Как ЗЕКСЛЕР собирал данные для большого исследования негативных отзывов о работодателях

2024-10-23 11:32:05 Время чтения 7 мин 370

Всем привет! На связи рекламное агентство Зекслер. Вот уже более 10 лет мы занимаемся полным циклом маркетинга. Для понимания глубинных причин и процессов в интернет-сегменте решили запустить фундаментальные исследования рынка. О всех своих инсайтах по результатам исследования мы уже рассказывали в этой статье, а данные выгрузили на сайте нашего проекта – Zexlab.ru. Сегодня расскажем о том, как мы собирали данные.

А пока подписывайтесь на наш ТГ-канал, будем рады новым подписчикам:)

Выбор источников для исследования

Начали с подбора источников. Собрали список самых, на наш взгляд, адекватных HR сайтов отзывов и выбрали самые посещаемые. Их и указали в настройках темы мониторинга.

Прописали поисковые запросы и объект тональности, запустили сбор упоминаний. В результате система собрала 18 637 отзывов за месяц.

И вот их то мы и решили взять за основу нашего исследования. Точнее не все отзывы, а только негативы. Положительные отзывы не всегда отражают полную картину, так как многие компании занимаются управлением HR репутацией и часть таких отзывов создано исключительно для корректировки рейтинга работодателя.

Корректировка тональности

Обработку данных начали с корректировки тональности, так как она не всегда проставляется корректно – было очень много разметок, которые правили в ручном режиме. Ниже приведен положительный отзыв, который никак нельзя назвать положительным.

Правили в несколько этапов. Сначала использовали фильтр по оценке.

Понятно, что иногда авторы отзывов промахиваются с оценкой, но в 98% случаев, если в тексте негатив, то и количество звезд меньше 4-х. Фильтр по оценке использовали от противного, сначала изучали все отзывы с оценкой 5 и 4 звезды и размечали их как позитивные, при этом отмечали, что этот кластер отработан.

К сожалению, не на всех сайтах отзывы с указанием рейтингов. С такими отзывами работали по другой схеме. Сначала отработали все отзывы категорий «Агрессия» и «Нецензурная лексика». Но и такого способа быстрой фильтрации сообщений оказалось недостаточно. Стали подбирать слова-индикаторы и, используя поиск, отбирать те отзывы, в которых они присутствуют. Какие-то маркеры отрабатывали очень хорошо, какие-то слабее.

Всего отобрали 55 маркеров для негативных отзывов и 63 для позитивных.

Тегирование проблем соискателей

Попутно с корректировкой тональности работали с настройкой тегов проблем соискателей:

  1. Низкая заработная плата.
  2. Обман по заработной плате.
  3. Собеседование.
  4. Упоминание конкретного сотрудника.
  5. Руководство.
  6. Обман при найме.
  7. Плохие условия труда.
  8. Плохой коллектив.
  9. Нарушение режима рабочего времени.
  10. Текучка в коллективе.
  11. Система штрафов.
  12. HR специалист.
  13. Плохая организация трудовых процессов.
  14. Стажировка.
  15. Нет системы мотивации.
  16. Серая заработная плата.
  17. Большая нагрузка.
  18. Нарушение порядка увольнения.
  19. Нарушение ТК РФ.
  20. Неофициальная заработная плата.
  21. Нет карьерного роста.
  22. Неофициальное трудоустройство.
  23. Накрутка отзывов по работодателю.
  24. Плохой социальный пакет.
  25. Бюрократия.

Тут всё по классике, подбирали запросы и прописывали минус-слова. 

Сортировка по типам бизнеса

И, казалось бы, всё – можно закрывать вопрос сбора данных. Но тут нам пришла идея проверить во всех ли секторах бизнеса одинаковое соотношение претензий к работодателю. Начали искать, как рассортировать все упоминания по секторам бизнеса. Ответ нашли во вкладке «Продукты».

Сначала обрадовались, но когда поняли, что сортировка продуктов даже путём тегирования невозможна, пришли к мысли, что придется все сортировать самостоятельно.

Выгрузили сводный отчёт и уже вручную стали проставлять сектора бизнеса. Сначала фильтровали сниппеты по тем словам, которые характеризуют бизнес. Например:

Те, компании, в сниппетах которых не было характерного слова (приблизительно 40%), отрабатывали вручную. Да, муторно. Но результат того стоил.

Вместо заключения

Интересный получился опыт. Будем пробовать ещё. Есть задумка, продумать свою систему для подобных исследований.

Спасибо, что дочитали нашу статью до конца. Рады были поделиться с вами деталями трудоемкого и довольно долгого процесса.

Не забывайте подписываться на ТГ-канал. В нём публикуем посты на тему рекламы, продвижения, дизайна, разработки и просто новости нашей дружной команды:)