Мы постарались осветить ключевые особенности, связанные с проведением эконометрических исследований: возможности, ограничения, методологию и оценку качества. Также поделимся бенчмарками ROAS для одной из категорий!
Эконометрика – достаточно трудозатратное исследование, которое позволяет сразу решить широкий спектр задач, связанных с маркетингом, а в некоторых случаях является незаменимым выбором. Можно выделить наиболее распространенные цели, которые ставятся маркетологами перед проведением исследования такого типа:
*ROMI или Return On Marketing Investment – возврат на инвестиции в маркетинг, который рассчитывают по формуле: (доход – расходы на маркетинг) / расходы на маркетинг * 100%
Зачастую результаты такого исследования служат основой для стратегического планирования маркетинговых коммуникаций. Если вы хотите получить ответы на несколько или даже все перечисленные выше вопросы, стоит задуматься об эконометрике.
Основой эконометрики является модель, которая с определенной точностью описывает динамику выбранного показателя (переменной). В качестве зависимой (предсказываемой) переменной в модели можно использовать метрики, которые наиболее важны для бизнеса: продажи, регистрации, посещение веб-сервисов и многие другие. В роли независимых (объясняющих) выступают рекламные коммуникации, макроэкономические изменения, динамика цены, сезонность, промоакции и прочие факторы, характерные для каждой отрасли.
Существует множество алгоритмов Machine Learning и основанных на них библиотек, которые можно использовать для моделирования экономических показателей: линейная регрессия, градиентный бустинг деревьев решений (XGBoost), авторегрессия со скользящим средним (SARIMAX), рекуррентная нейросеть (LSTM), Lightweight MMM от Google, Robyn от Meta и другие.
Линейная регрессия может уступать более сложным алгоритмам в точности прогнозов, но обеспечивает наилучшую интерпретацию модели, т.к. позволяет получить абсолютное значение вклада каждого фактора в целевой показатель. Основной недостаток линейной модели, собственно, линейность, компенсируются предварительным преобразованием некоторых факторов, например, активности в медиаканалах.
Уравнение простой линейной регрессии выглядит так: y = a + b * x, где
y – целевая (зависимая) переменная, например, продажи;
a – значение y, когда x = 0 (константа или базовый уровень);
x – независимая переменная (фактор), влияющая на целевую, например, медиа бюджет;
b – коэффициент линейной регрессии независимого фактора.
Наилучшее уравнение выбирается так, чтобы линия проходила максимально возможно ближе ко всем точкам с помощью метода наименьших квадратов (МНК). Выше приведено уравнение простой линейной регрессии, т.е. рассматривается влияние только одного фактора. В большинстве же случаев уравнение имеет столько пар b и x, сколько значимых факторов было включено в модель – множественная линейная регрессия.
Эконометрика предъявляет сравнительно строгие требования к исходным данным, что подразумевает активное участие не только Исполнителя, но и Заказчика на подготовительном этапе. Если работа непосредственно над моделью занимает 3 – 4 недели, то бывает, что этап сбора данных длится не меньше. Некоторые основные правила и особенности, которые нужно иметь ввиду, чтобы ожидания от исследования и результат совпали:
Одним из ключевых результатов эконометрического анализа является декомпозиция вклада факторов в модельную оценку независимой переменной. Для полноты картины рассматриваются как положительно влияющие, так и дающие отрицательный вклад факторы: рекламная активность конкурентов, макроэкономические потрясения, эпидемии и другие.
Абсолютную величину вклада каждого фактора можно рассчитать в той же детализации, как исходные данные были заложены в модель, например, по неделям, а потом агрегировать до нужных временных промежутков. Размещение в медиаканалах имеет эффективный объем и точку, после достижения которой увеличение бюджета уже не дает роста продаж или другой целевой метрики – достигается насыщение. Данная зависимость имеет форму кривой, которая для охватных каналов зачастую выглядит S-образной:
Кривая насыщения может быть более крутой или пологой, иметь точку перегиба и выходить на плато на меньшем или большем объеме – точные параметры этой зависимости отличаются для разных медиа, категорий, брендов и даже креатива. Одно из главных преимуществ эконометрики – можно достаточно уверенно сказать, какой объем размещения в каждом канале нужен, чтобы достигнуть KPI и какой при этом будет ROAS или CPA.
Результаты наших расчетов ROAS (отношение инвестиций в рекламу к полученной от них выручке) с начала 2023 года по белее чем десяти брендам лекарственных препаратов собрали на диаграмме размаха, которую часто называют «ящик с усами». Такой тип диаграмм часто используют в статистике для анализ агрегированных данных. Верхняя и нижняя граница «ящика» обозначают первый квартиль (такое значение, ниже которого только 25% оценок) и третий квартиль (такое значение, выше которой только 25% оценок). Горизонтальная линия между ними является медианой, а крестик – средним значением. «Усы» показывают результаты исследований с минимальным и максимальным значением ROAS по медиа.
Важно отметить, что ROAS зависит от многих факторов: категории, известности бренда, креатива, площадок, buying power, сезонности и других. Найти два бренда с одинаковым ROAS достаточно сложно, но общую картину составить можно. Среди digital-каналов наибольшую отдачу показывает контекстная реклама (поиск и сети). Что касается ТВ, то при сравнительно высоком вкладе в продажи, ROAS размещения в этом канале ниже, чем в digital. Оффлайн медиа работают в большей степени на верх воронки (знание и рассмотрение к покупке) и поддерживает продажи бренда еще и в долгосрочной перспективе.
Ни одна модель не может дать 100% попадание в факт и абсолютно точно предсказать будущее, но есть несколько основных метрик для того, чтобы оценить качество исследования.
При этом R2, слишком близкий к 100%, говорит скорее о переобучении (подгонке) модели, чем о высоком качестве. Настолько высокий показатель может означать, что модель имеет слабую обобщающую способность и очень ограниченно пригодна для построения прогнозов.
Также рассчитывается ряд дополнительных статистических тестов, где в основе, как правило, лежит нулевая гипотеза, которая на определённом уровне значимости либо принимается, либо отвергается в пользу альтернативной. К наиболее важным тестам и показателям можно отнести:
Близость остатков модели к нормальному распределению – гистограмма распределения ошибок похожа на колокол, но допускается умеренная асимметрия.
Недостаточно хорошие результаты тестов даже при высоких R2 и MAPE свидетельствуют о том, что полученные в модели оценки для факторов ненадежны.
У эконометрики есть свой «срок годности». Если модель периодически не обновлять, то есть, обучать на свежих данных и включать новые значимые факторы, то со временем результаты ее прогнозов все меньше будут сходиться с фактом. Частота обновления модели зависит от поставленных задач, гранулярности и периодичности выхода данных, появления новых факторов, но рекомендуем обновлять модели не реже чем раз в 9 – 12 месяцев.
В течение года Starlink проводит десятки эконометрических и других исследований как для клиентов нашего медиасервиса, так и компаний, заинтересованных непосредственно в измерении эффективности инвестиций в маркетинг. Будем рады пообщаться и ответить на ваши вопросы!