Реклама внутри мобильных приложений (in-app) уже не первый год используется как источник трафика и становится всё более востребованной среди различных брендов. А это значит, что у рекламодателей время от времени возникают вопросы о продвижении в приложениях и работе с мобильной DSP (Demand Side Platform — это программатик-платформа для автоматизированной закупки in-app инвентаря). С чего и как начать продвижение? Как быстрее запустить рекламные кампании? Как проходит обучение платформы и нужно ли оно? Команда Rocket10 в колонке для Sostav подробно рассказала о тонкостях DSP, ценности неатрибуцированных данных, различиях между lookalike и предиктивными моделями.
Что такое неатрибуцированные данные и зачем они нужны DSP
Для начала давайте поймём, что такое неатрибуцированные данные? Это информация об установках и событиях по воронке продаж приложения рекламодателя (оформление заказа, покупка, оформление подписки и другое), которые не приписаны конкретной платформе. Неатрибуцированные данные нужны мобильной платформе и рекламодателю для оптимизации рекламных кампаний и анализа поведения пользователей.
Мобильная платформа с помощью неатрибуцированных данных обучает lookalike модели, чтобы уже со старта рекламные кампании работали более прицельно, эффективно и рационально с точки зрения маркетингового бюджета. Обученные на максимально полных и качественных данных lookalike модели способны разделять весь приходящий трафик по вероятностям получения желаемого целевого действия. То есть они помогают начать рекламные кампании сразу с использованием предиктивных алгоритмов платформы. Это в свою очередь помогает более грамотно расходовать маркетинговый бюджет, пока обучаются стабильные и полноценные предиктивные модели.
Чтобы начать автоматическую передачу неатрибуцированных данных платформе, рекламодателю нужно активировать соответствующую настройку в своём мобильном трекере.
Какие именно неатрибуцированные данные следует передавать платформе и для чего
Итак, чуть выше мы уже выяснили, что неатрибуцированные данные необходимы платформе для обучения lookalike моделей. Теперь давайте более детально разберёмся, какие именно неатрибуцированные данные нужны и для чего конкретно они используются? Только сперва немного освежим в памяти, что такое lookalike модели и по какому принципу они работают.
Lookalike модель — это инструмент, который часто используют для поиска новой аудитории, максимально схожей с уже существующими юзерами приложения. Другими словами, это инструмент, который фильтрует и сортирует весь доступный для DSP трафик по уровням «похожести» на эталонную для рекламодателя целевую аудиторию.
Lookalike модели строятся на основе данных о поведении и интересах существующих пользователей приложения, таких как установки, покупки и так далее. Алгоритмы ML и AI анализируют эту информацию и выявляют общие черты и паттерны поведения, которые могут быть использованы для поиска новой аудитории.
То есть lookalike модель — это инструмент, который:
- берёт некоторую аудиторию, которую рекламодатель называет целевой;
- анализирует всю заданную аудиторию (например, все аукционы по географическому признаку, в которых участвовала мобильная платформа) на факт «похожести» на целевую;
- в зависимости от степени близости поступающих новых запросов к целевой аудитории, lookalike модель применяет к базовой ставке коэффициент (чем более «целевой» запрос, тем выше на него будет ставка).
Lookalike модели нужны, чтобы со старта рекламной кампании отсеять или снизить ставку на те запросы, которые не попадают близко к целевой аудитории. Либо, наоборот, выкупать дороже ту аудиторию, которая близка к целевой.
Ставка (bid) — это определяющий параметр аукциона, на котором покупается показ рекламы. Чем выше ставка, тем больше шанс выиграть аукцион и показать рекламу. Lookalike модели нужны, чтобы чаще показывать рекламу целевой аудитории, а менее целевая аудитория будет либо игнорироваться (ставка =0), либо выкупаться с существенным дисконтом.
Соответственно, чтобы этот метод работал эффективно, необходимы данные, которые определяют и характеризуют эту идеальную аудиторию. Больше качественных данных — точнее инструмент.
- Если рекламодателя интересует целевое действие «Установка», то ему следует предоставить данные об установках своего приложения. А также обо всех событиях, которые показывают, что новый пользователь не просто скачал приложение, но также открыл его и совершил в нём какие-то первоначальные действия. Эта дополнительная информация о последующих действиях пользователя в приложении помогает исключать из выборки фродовые установки.
- Если рекламодателя интересует какое-то другое целевое действие, то ему следует передать события по всей воронке продаж внутри приложения. Это связано с тем, что при нехватке данных по необходимому целевому действию, можно использовать события выше по воронке продаж.
- А если рекламодателя интересует ROI, то ему следует передать данные о покупках. А для большей эффективности — с суммами покупок. Это поможет в построении lookalike моделей, которые будут целенаправленно работать на возврат рекламного бюджета.
Чем больше качественных и значимых данных о конкретном целевом действии и о сопутствующих действиях пользователя передаёт платформе рекламодатель, тем больше опций построить максимально точные и правильные lookalike модели. А точные lookalike модели могут поспособствовать оптимизации стоимости обучения полноценных предиктивных моделей — о них мы поговорим позже.
Отдельно хотим обратить внимание на «чистоту» данных. Если среди неатрибуцированных данных вдруг затесались события от фродового или мотивированного трафика, то все эти фальшивки будут непосредственно влиять на точность lookalike моделей в худшую сторону.
Важно: все события, которые предаются платформе из мобильного трекера рекламодателя, привязаны к рекламному идентификатору пользователя. Если идентификатор открыт в настройках устройства, то все участники рынка in-app рекламы имеют к нему доступ.
Почему следует передавать suppression-лист и что такое advanced privacy в настройках мобильного трекера
Suppression-лист — это список устройств, на которых уже установлено или было установлено конкретное приложение. Его всегда следует передавать платформе, так как это позволяет исключить текущих пользователей приложения из UA или же сделать ретаргетинг на текущих пользователей. Чтобы его передать, рекламодателю нужно активировать соответствующую функцию в своем мобильном трекере.
Другой частый вопрос: что будет, если включить advanced privacy? Advanced privacy — это настройка приватности в мобильном трекере. Если её включить, то платформе вообще не передаются какие-либо технические данные, кроме факта события. А это означает, что предиктивную модель построить нельзя, так как нет каких-либо данных для анализа.
Что такое предиктивные модели и зачем они нужны
Предиктивная модель — это продукт нейросети, обученной на данных, которые мобильная платформа получила непосредственно со своих рекламных кампаний. Другими словами, это атрибуцированные платформе данные. Результатом работы нейросети является набор «правил» (фич), согласно которым система определяет ставку для каждого конкретного приходящего запроса на показ рекламы. Нейросеть рассматривает массив атрибуцированных данных и определяет ставки исходя из тех результатов, которые в нее загружены для обучения.
Упрощённый пример
На основании эксперимента (периода обучения) нейросеть выяснила следующее:
- Синие шарики продаются в среднем по $4, внутри двух из десяти синих шариков находится конфета;
- Красные шарики продаются в среднем по $5, в пяти из десяти красных шариков находится конфета;
- Черные шарики продаются в среднем по $10, конфет в них нет.
Чтобы получить конфету, нужно купить пять синих шариков (в среднем стоит $20), либо два красных шарика (в среднем стоит $10). А черные шарики покупать не нужно, там конфет нет.
Далее задаем нашей предиктивной модели таргет: хочу покупать конфеты по $10. И получаем, что синие шарики она будет пытаться купить по $2, потому что в среднем надо купить пять шариков, чтобы получить конфету. Красные — по $5, потому что в среднем надо купить два шарика, чтобы получить конфету. Черные вообще покупать не будет. Если задать таргет: хочу покупать конфеты по $20, то красные шарики будут куплены по $10, а синие шарики по $4.
Основное отличие предиктивной модели от lookalike модели заключается в том, что lookalike модель не знает цен (на самом деле не только цен). Она может только проинформировать, что черные шарики покупать не нужно, а синие нужно покупать в 2,5 раза дешевле, чем красные.
В этом упрощённом примере только одно правило — цвет. А в нейросети мобильной платформы этих правил много десятков. По ним модель и делит весь рынок по вероятностям конверсий. И на основании данных о ценах и вероятностях конверсий делает ставки.
Что такое тестовый период и как он выглядит
Тестовый период — это период обучения предиктивной модели. Предиктивная модель отличается от lookalike модели тем, что она обучается на атрибуцированных данных. Другими словами, у платформы есть весь порядок действий, который приводит или не приводит к необходимому результату: реквест на показ рекламы пользователю, бид (ставка), победа или поражение в аукционе, показ или не показ рекламы, конверсия или её отсутствие и так далее.
То есть предиктивная модель имеет доступ к более широким и полным данным по конкретному целевому действию и делает более точное предсказание о совершении установки или другого целевого действия (точность зависит от объема атрибуцированных данных). В обучении точной предиктивной модели роль играют как «хорошие», так и условно «плохие» (например, был показ рекламы, который не привёл к установке) атрибуцированные данные. Обычно платформе требуется получить около 1000 целевых событий (варьируется в зависимости от рекламодателя и его вертикали), чтобы обучить первые итерации предиктивной модели. В дальнейшем в ходе рекламной компании она постоянно дообучается и совершенствуется.
Для набора этих данных на этапе обучения берется одна или несколько lookalike моделей и в обязательном порядке одна широкая рекламная кампания на небольшую часть бюджета. Широкая кампания необходима для набора данных, которые будут лишены какого-либо таргетинга.
Если для построения lookalike модели не хватает данных, допустим, рекламодатель по какой-то причине их не предоставил, либо рекламодателя интересует трафик без идентификатора пользователя (характерно для iOS), нужно прибегать к другим, не столь эффективным, методам набора данных:
- использовать кампании с ручными таргетингами, которые подбираются логически;
- на основании ручного анализа неатрибуцированных данных формировать вайтлисты похожих по описанию или названию приложений;
- делить рынок по разным срезам, пробовать разные срезы с разными ставками и тому подобное.
Как правило, обучение предиктивной модели такими инструментами требует бОльших финансовых вливаний на этом этапе. В целом, чем более широкие и разнообразные данные получает платформа на этапе обучения, тем лучше и точнее итоговые результаты. Все эти методы помогают рекламодателю оптимизировать маркетинговый бюджет на тестовом периоде.
DSP-платформа — это про данные и работу с ними. Чем больше качественных данных, тем эффективнее работает платформа.
В заключение хотим немного перефразировать цитату Натана Ротшильда. Кто владеет информацией и делится ею с DSP — тот:
- эффективно продвигает свои продукты в приложениях;
- получает максимум возможностей от своего маркетингового бюджета;
- обогащает знания о своей целевой аудитории и понимает как масштабироваться.
Надеемся, что данный материал поможет рекламодателям лучше разбираться в работе DSP и быстрее достигать запланированных результатов.