Главной целью применения машинного обучения в медиапланировании является получение как можно более точного прогноза. Отдел Data Science Havas Media (Россия) (входит в группу АДВ ) рассказывает, как улучшить точность прогноза ТВ-аффинити в 2 раза и снизить погрешность планового CTR на 50%.
ТВ-аффинити
Задача: прогнозирование ТВ-аффинити на различные целевые аудитории, исходя из будущей сетки канала.
Этот показатель, по сути, отражает интерес некоторой социальной группы к телевизионным событиям. И зная, что какую-то программу будут лучше смотреть молодые девушки, есть возможность поставить в сетку релевантный рекламный ролик.
При этом существуют прогнозы рейтингов на разные целевые группы, которые предоставляет НРА. Однако набор этих целевых аудиторий в данных НРА, доступных для агентства, зачастую ограничен. А нам нужен инструмент, который позволит прогнозировать ТВ-рейтинги на любую целевую группу «здесь и сейчас», независимо от ее размера и определения. В медийных агентствах решением задачи прогнозирования занимаются, как правило, ТВ-баеры. По нашим оценкам, их погрешность на рекламную кампанию в среднем составляет 3−4%.
Команда Data Science Havas Media решила вопрос с погрешностью за счёт автоматизированного алгоритма. В его основе — метод опорных векторов для регрессии (SVR). На рисунке ниже показан пример — предсказательная способность модели для телесмотрения целевой аудитории на «Первом канале».
Анализ показал, что в среднем погрешность прогноза данного алгоритма составляет 1−2% на ТВ-кампанию. Таким образом, процесс работы был автоматизирован, а точность прогноза в 2 раза улучшена. Скорость обучения модели составляет в среднем около 4 минут на одну целевую группу для одного канал. На данный момент разработанный алгоритм интегрирован в платформу АДВ Aizek.Trade как один из критериев автоматической постановки ТВ-роликов.
Кампании в digital
Задача: прогнозирование показателей кампаний в digital с минимальной погрешностью.
Часто при планировании programmatic кампаний с моделью покупки по показам менеджеры закладывают в планы «средние по больнице» показатели кликабельности (CTR). Фактические значения этих показателей, как правило, имеют сильные отличия от прогнозных. Алгоритм на основе CatBoost от «Яндекс», который был реализован в Havas Media, позволил снизить погрешность прогноза CTR на 50%. Всего в модели используется 15 факторов, среди которых присутствуют категория клиента, размер ставки, продолжительность кампании, формат рекламного сообщения, платформа размещения и другие. Стоит отметить, что погрешность в прогнозных моделях таких показателей всё еще остается достаточно высокой, но это обусловлено тем, что на данный момент никак не учитывается качество креатива и его сообщение. Однако в будущем, когда будет накоплено достаточно данных, удастся снизить погрешность прогноза еще сильнее.
Клик на рекламное сообщение является далеко не самым важным действием потребителя для наших клиентов. Поэтому мы в агентстве Havas Media пошли еще дальше и разработали алгоритм прогнозирования ассоциированных и last click конверсий для рекламных digital кампаний. Эти показатели уже существенно ближе к бизнесу и поэтому представляют из себя больший интерес.
На схеме ниже показан пример алгоритма моделирования показателей конверсии для digital-кампаний.
Дмитрий Рыжкин, Data Science Director Havas Media:
Для применения методов машинного обучения не обязательно обладать высокими компетенциями в программировании. Существует много готовых решений. Например, TensorFlow от Google или CatBoost от «Яндекс». С их помощью можно строить и тестировать модели даже без точного представления, как это все работает с точки зрения математики. Достаточно обладать базовыми навыками программирования на R или Phyton. Но для достижения результата знание основ статистики и методов машинного обучения — все же необходимо, ведь применяемый метод должен соответствовать задаче.