Собранному верить: как интернет-магазину получать качественные данные мониторинга цен

Смотрите в каталоге
Ремонт и строительство

Владеть точными, актуальными данными о конкурентах — значит, принимать верные решения. Особенно это важно при ценообразовании на раскаленном рынке e-com.

Как контролировать качество данных о конкурентах — рассказывает Дмитрий Граевский, технический директор сервиса автоматического мониторинга цен Priceva.

Качество данных: что это значит

Один из основных факторов для онлайн-покупки — цена. Пара кликов — и клиент выбирает наиболее привлекательное предложение в любом интернет-магазине или на маркетплейсе. Поэтому сегодня особенно важно быть «в рынке» по ценам.

Если вы применяете динамическое ценообразование и регулярно мониторите цены конкурентов (а в онлайн-ритейле они меняются ежедневно, если не ежечасно), примите поздравления — в ваших руках еще один инструмент для увеличения прибыли.

Чтобы ценовая стратегия приносила результат, в ее основе должны лежать качественные данные о конкурентах. Качественные — значит:

  • актуальные: по нашим, профессиональным, меркам это информация, давностью не более 18 часов, но каждая компания сама определяет порог актуальности для своей ниши;
  • точные: стандарт качества данных — не менее 98%, т.е. количество ошибок не должно превышать 2% на весь массив;
  • регулярные: сбор данных происходит не разово или от случая к случаю; для динамического ценообразования необходимо постоянно видеть изменение цен на рынке.

Цена ошибки: что происходит, если данные неточны

Кроме информации о ценах конкурентов в основу динамического ценообразования ложатся данные о наличии товара, и скидках (если есть). Это обязательные параметры, которые необходимо собирать при мониторинге.

 

Цена, скидка, наличие указаны на карточке товара.

И не так важно, каким методом вы собираете эти сведения — вручную или используете сервис. Важно, что даже самые эффективные инструменты дают сбой, данные будут неточными, и тогда...

Ошиблись с ценой «вниз»

Представим, что так и случилось. Новые цены в интернет-магазине выставлены на основе неверной информации и ниже, чем у конкурентов.

  • Потеря маржинальности. Это самое очевидное последствие: могли бы продавать по 100 рублей, а продаете по 90.
  • Удар по репутации. Продавать по заявленной цене невозможно, и магазин вынужден отменить заказы. Но пользователи уже ждут выгодную покупку — лояльность подорвана, клиенты уходят к конкурентам.
  • Санкции от маркетплейсов. Можно смоделировать разные ситуации с неверной ценой на маркетплейсе, перекосом цен между площадкой и сайтом — в любом случае магазин останется в проигрыше, а в худшем — еще и попадет под санкции. Например, Я.Маркет за нарушения может отключить магазин на 10 дней — фактически половина месяца продаж.
  • Санкции от поставщиков за несоблюдение РРЦ. Поставщик может отменить ретробонус или прекратить отгрузки, если выставленная по ошибке цена нарушает рекомендованную.
  • Слив рекламного бюджета. Самый распространенный сценарий: выставили ошибочно низку цену, запустили платную рекламу. Популярная модель оплаты такой рекламы — за клики (CPC). Пользователи активно кликают на выгодное предложение — деньги со счета списываются, но продавать по такой цене нельзя. Итог: продаж нет, а маркетинговый бюджет слит.

Ошиблись с ценой «вверх»

  • Конверсия в покупку резко падает, магазин теряет прибыль.
  • Падает оборачиваемость товара, деньги заморожены в товаре.
  • Позиции в поисковой выдаче снижаются. Увидев неадекватные цены, пользователи уходят, снижаются поведенческие факторы сайта — позиции сайта в поисковой выдаче падают.
  • Происходит отток клиентов, утративших лояльность, — магазин кажется «дорогим», даже если столкнулись с единичной ошибочной ценой.

Снижайте риски: как контролировать качество данных

Почему данные могут быть некачественными? Здесь как раз важен метод мониторинга — ручной или автоматический: в каждом свои причины, индикаторы сбоев, способы контроля. Рассмотрим их подробнее.

  1. Качество данных при ручном мониторинге

Удивитесь, но, по отзывам наших пользователей, ручной мониторинг по точности данных не уступает автоматическому. Пожалуй, на небольших объемах данных — 10-20 товарных позиций и столько же конкурентов для мониторинга — можно и согласиться. На сайтах достаточно нюансов, с которыми человек справляется лучше роботов. Например, изменилась верстка страницы, дизайн, форматирование — это происходит очень часто, — человек сразу видит эти изменения.

А программы для сбора информации — это роботы, которые считывают html-разметку сайта и ищут в ней цену. Изменилась разметка — парсер попроще снимет неверные данные и продолжит работу. Программы посложнее остановят работу или проанализируют страницу и все равно соберут данные.

По нашим наблюдениям, из 30 000 сайтов, по которым сейчас ведем мониторинг, порядка 200 каждый день (!) делают значительные изменения на карточках товаров.

Поэтому категорийных менеджеров, маркетологов и других специалистов, касающихся ценообразования, устраивает качество ручного мониторинга пока товаров немного. Однако, когда число позиций увеличивается, ручной мониторинг становится малоэффективным, так как:

  • возрастает число ошибок,
  • тратиться слишком много рабочего времени,
  • данные теряют актуальность уже в процессе сбора — это самый серьезный удар по качеству.

Ирина Макаль, маркетолог-аналитик, «ТехноНиколь»:

— При ручном анализе нам удавалось получать данные по 50 позициям 1 раз в месяц — быстрее не успевали. Данные автоматического парсинга снимаем 2 раза в неделю, при необходимости ежедневно. Глобальный анализ и изменение цен производим 1–2 раза в месяц.

Виктор Беляев, менеджер по категорийному анализу, «АВС-электро»:

— Результаты ручного анализа обновляли раз в месяц. Сейчас автоматически собираем исходные данные 2 раза в неделю и используем в своей системе.

Как добиться качества данных при ручном мониторинге

Если вы выбрали ручной мониторинг, проверьте, все ли учли в этом бизнес-процессе.

  1. Исполнитель

Закрепите эту задачу за конкретным сотрудником, пропишите регламент работ.

  1. Периодичность

Определите периодичность мониторинга, посильную для сотрудника и приемлемую в плане актуальности информации.

  1. Сбор данных

Проведите тестовые переходы по выбранным ссылкам на товары конкурентов. Копируйте и сохраняйте в нужном формате информацию по ценам, скидкам, наличию. Засеките время, которое потратили на весь список товаров.

  1. Валидация

Проверьте результаты на ошибки. Зафиксируйте, какой процент ошибок выявили — даже машинные алгоритмы дают погрешность, что говорить о ручной работе. Поэтому рекомендуем применять правило 10%: периодически проверяйте 10% результатов мониторинга, и если погрешность составит 10% и более, придется начинать работу снова.

Важно! В идеале контрольную проверку данных следует делать не позже 24 часов со времени последнего мониторинга. Цены за это время могут измениться: например, произойдет репрайсинг или вступит в силу акция.

А теперь рассмотрим причины неточных данных при автоматическом парсинге.

2. Качество данных при автоматическом мониторинге

Выше мы приводили принцип работы автоматического парсера и затронули одну из причин неточных данных. С нее и начнем, но уже подробно и с примерами: вы получите список критериев, по которым можно оценивать качество данных, и индикаторов, которые укажут на сбой.

Критерий 1: Верно ли прочитаны данные с сайта

Пример

Представим программу-парсер в виде привычного робота. Допустим, мы заложили в него алгоритм: подойди к двери, подними руку на метр, возьми круглое, толкни вперед. А владелец двери перенес ручку на 20 см выше. Робот подойдет, поднимет руку на метр, будет брать пустоту, толкать закрытую дверь и сообщать, что алгоритм выполнен, хотя дверь так и не открыта.

Верстка и формат цены на сайте изменились. В результатах мониторинга увидим: все товары с сайта не в наличии, другая валюта, резкий скачок цен по всему сайту, резкое увеличение скидки (относительно новой цены).

Если изменения произошли по всему сайту конкурента, то на большом массиве данных такие сбои очевидны — резкие изменения, перекосы данных. Сложнее найти точечные изменения, когда, конкурент изменил отдельные карточки товаров.

Сложные парсеры при таких изменениях продолжают работать и корректно собирать информацию. Программы попроще останавливают работу и дают сигнал, что собрать данные корректно невозможно — решить проблему может владелец парсера. Совсем простые программы открывают «запертые двери»: не подавая никаких сигналов, продолжают собирать некорректные данные, а пользователь даже не подозревает об этом. Взаимосвязь между качеством парсера и компетенциями разработчика комментировать уже излишне.

Критерий 2: Актуальные данные или нет

Какие данные считать достаточно актуальными для принятия решений? По нашим внутренним стандартам данные, которым

  • меньше 12 часов, считаются актуальными,
  • больше 12 часов, — среднеактуальными,
  • больше 18 часов, — неактуальными.

Для бизнеса этот порог индивидуален: как правило, компания знает, как часто проводят репрайсинг ключевые конкуренты. Или понимает периодичность ценовых изменений в своей нише: например, товары с ярко выраженной сезонностью, импортные товары, зависящие от курса валют.

Пример

В 14.00 мы ожидаем курьера с посылкой и запрограммировали робота открыть дверь. Но ошиблись, и робот пошел открывать на час раньше. Формально работа выполнена: робот дверь открыл и отчитался. Но фактически результата нет: посылку курьер не вручил.

Чтобы скорректировать свой порог актуальности (и настройки парсера), анализируйте при каждом очередном парсинге по каждому конкуренту: как часто и как много цен меняется. В противном случае рискуете получать информацию, непригодную для правильного ценообразования. Например, запустили парсинг в понедельник, а ключевой конкурент обновляет цены по вторникам — получается, что целую неделю торгуете по неактуальным ценам.

Также сбой может произойти из-за проблем со скоростью сбора информации.

Пример

Мы заказали мороженое, запрограммировали робота открыть дверь курьеру. Заказ доставил стажер: долго искал адрес, звонил диспетчеру... В итоге заказ растаял, и робот принес не совсем то, что мы ожидали, и позже, чем рассчитывали.

В случае с сайтами такая задержка в передаче данных может произойти по разным причинам: медленно работает сам ресурс (сломан, перегружен), в список для мониторинга добавили объем новых адресов, превышающий мощность парсера.

Критерий 3: Тот ли товар мы мониторим

Качество данных по этому критерию может теряться на этапе мэтчинга — подбора ссылок для мониторинга.

Пример

Ожидаем мастера — починить кондиционер. Знаем, что сотрудники этой фирмы носят синие комбинезоны, и запрограммировали робота, чтобы он открыл дверь мужчине в синей одежде. В назначенный час робот подъезжает к двери, впускает мужчину, но в синем деловом костюме. Формально работа снова выполнена: робот дверь открыл, человека в синем пустил. А по факту приходится слушать продавца кофеварок в комнате со сломанным кондиционером.

Если происходит ошибка в подборе ссылок на аналогичные товары конкурентов, данные собираются не по тем позициям, и правила переоценки также срабатывают некорректно — конкурируем не с тем, с чем надо.

Иногда разница между товарам — в одной букве или цифре в описании модели

Но чаще всего ошибка из-за неверного сопоставления по кратности — единице, за которую указана цена. Сегодня карточка товара — целый интерфейс, где пользователь может выбрать не только размер, цвет, но и фасовку.

На одном сайте цена по умолчанию выставляется за 0,6 кг, на другом — за 2,5.

Делать мэтчинг вручную или автоматически — не имеет значения в плане ошибок, они будут в любом случае. При ручном сопоставлении всегда есть место человеческому фактору, при автоматическом — техническим сложностям. Выход — следить за индикаторами ошибок и точечно устранять сбои.

Критерий 4: Видит ли ЦА данные, которые собираем

Отслеживать качество данных по этому критерию в первую очередь необходимо компаниям, которые:

  • работают в регионах и отслеживают региональные цены конкурентов,
  • ведут разную ценовую политику для разных групп пользователей.

Вот упрощенный пример, когда неправильный учет региона в настройках приводит к неточным данным.

Мы заходим на сайт из Самары, ресурс автоматически определяет регион и показывает цену — 11 000 рублей. Зайди мы из Москвы, получили бы цену 11 500. Отправили на этот сайт робота: он заходит инкогнито и успешно считывает московские 11 500. Мы не проверили данные и начали продавать в Самаре по завышенной — московской цене.

А вот пример, когда разные цены действуют для разных групп пользователей (по подписке, по картам лояльности и т.д.).

Критерий 5: Обход защиты сайтов от сканирования

Многие компании хотят получать данные о конкурентах, но своими делиться не собираются. В 2019 году мы наблюдали на рынке бум систем защиты от сканирования. Сейчас, по нашим данным 1,7% сайтов — в основном, крупные игроки на отечественном рынке ритейла — имеют такую защиту.

Как выбрать качественный парсер

Естественный вопрос после всех примеров, табличек и показателей — что с этим делать?

В случае с ручным мониторингом очевидно: отладить бизнес-процесс, как мы описали в начале статьи.

В случае с автоматизированными решениями для самостоятельных шагов простора не много:

  • регулярно проводите проверку данных по приведенным здесь индикаторам,
  • корректируйте настройки парсера, которые доступны вам как пользователю (обычно, это мэтчинг, указание региона, кратности, валюты, типа скидки, периодичности парсинга),
  • при ошибках, которые недоступны для самостоятельной корректировки, обращайтесь в техподдержку сервиса.

Многих проблем сможете избежать, если изначально выберете для работы качественный парсер. Как это сделать, что спрашивать у разработчиков при выборе сервиса и какие ответы характеризуют надежного разработчика? Воспользуйтесь чек-листом:

Дмитрий Граевский, технический директор сервиса автоматического мониторинга цен Priceva.
Компании и сервисы: ТехноНИКОЛЬ, АВС-электро, Priceva
Автор: Дмитрий Граевский

Подписаться на новости

Читайте также

Обсуждение с экспертами новостей в e-commerce

Последние новости рынка электронной торговли мы обсудим с нашими экспертами. Что думают о происходящем предприниматели и не только. Сегодня среди них: Елена Майер, PR-менеджер digital-агентства «Интериум»; Андрей Белянин, генеральный директор группы компаний «Тамаки» и другие.

далее →

Экосистема рынка performance-маркетинга

Эксперты рабочей группы комитета IAB Russia по performance-маркетингу и смежным направлениям выпустили новую карту сегмента, которая включает более 160 компаний. Экосистема отражает актуальную структуру отрасли — она поможет игрокам лучше ориентироваться на быстрорастущем рынке performance-маркетинга.

далее →

Зачем анализировать поиск по сайту, и сколько денег вы теряете на ненайденных товарах?

Вы знаете, какие товары клиенты вашего интернет-магазина ищут, но не находят? И сколько денег вы теряете, потому что в ассортименте нет позиций, которые пользуются спросом? Ответы на эти вопросы есть в аналитике ненайденных товаров.

далее →

Топ-50 онлайн-ритейлеров в соцмедиа в 2021 году

Brand Analytics представляет рейтинг компаний рынка e-commerce, которые наиболее активно обсуждались пользователями в русскоязычных социальных медиа в первом полугодии 2021 года.

далее →

Исследование: какие спорттовары скупали россияне на фоне Евро-2020

Аналитики AliExpress Россия и партнерской сети Admitad Affiliate изучили, как изменился спрос на спортивные товары во время Евро-2020. Они выяснили, какие виды спорта в приоритете у россиян и в каких городах инвентарь покупают чаще всего.

далее →

X
Нажмите «Нравится»,
чтобы читать Shopolog.ru в Facebook