Рынок больших данных растёт, всё больше компаний готовы внедрять data driven подход в свои процессы. Следующий шаг для развития сегмента — обогащение данных и мэтчинг с партнёрами. Алексей Каштанов, генеральный директор Platforma (совместное предприятие «Ростелекома» и ВТБ), рассказал Sostav, как объединение данных может стимулировать развитие рынка, и как бизнесу получить от этого дополнительную ценность.
Сейчас все крупные компании (технологические, операторы связи, ОФД) создают свои платформы данных. Почему вы решили выходить на такой достаточно конкурентный рынок?
Рынок данных постоянно растет, объём данных в мире удваивается каждые полтора года. По оценке Statista, в 2020 году информация, которая хранилась в частных IT-структурах, составляла почти 60 зеттабайт, а к 2025 году превысит 200 зеттабайт. Несмотря на то, что работа с большими данными становится всё популярнее с каждым годом, рано говорить о том, что рынок насыщен игроками. Рынок находится в фазе роста, и это удачное время, чтобы занять свою нишу.
Мы выявили проблемы, которые есть на рынке больших данных и инструментов по работе с ними, и решили предложить рынку новый подход и продукты, созданные на основе данных «Ростелекома» и ВТБ, которые раньше были недоступны для внешних игроков. Нам кажется, это следующий шаг для рынка, когда различные игроки могут объединяться и получать из этого дополнительную ценность.
На рынке отмечаются два противоположных тренда: с одной стороны, крупнейшие компании создают закрытые walled gardens, с другой — появляются коллаборации между игроками рынка данных. Почему вы выбрали направление data-партнёртства? Какое преимущество получит компания, которая сможет объединить множество игроков рынка данных на своей платформе?
Крупные игроки уже научились работать с данными и получать от них выгоду. Партнёрства позволяют получить дополнительную ценность из объединения данных: чем больше пересечённых между собой данных, тем объективнее общая картина, на основе которой можно строить более точные продукты, модели, прогнозы и монетизировать их.
Максимальное обогащение данных и мэтчинг с партнёрами — это и есть следующий шаг для развития рынка. Конечно, можно строить закрытую систему и собирать данные из разных областей самостоятельно, к примеру, за очень большие деньги получить данные сотовых операторов и попытаться выявить теории, применить их на своих продуктах и надеяться на этом заработать. Но, во-первых, это долго, во-вторых, жутко дорого. Нам кажется, что объединиться в партнёрство проще и быстрее.
Возможно, это звучит как утопия, но мы видим в этом большой бизнес-потенциал и планируем к 2025 году занять порядка 10% рынка продуктов на основе big data, которые будут релевантны нашей стратегии, включающей рекламный рынок, финансовые сервисы, геопространственный анализ и сервисы на основе облачных решений.
Какие несовершенства существующих инструментов и подходов вы видите?
Мы видим несовершенства в трёх основных направлениях. Первое — технологическое. До сих пор нет единого решения, которому доверяют и в безопасности которого уверены все участники рынка. Это — следствие достаточно жёстких законов, не учитывающих интересы бизнеса.
Коммерческая организация, которая хочет деперсонализировать данные, не поймёт из Федерального закона «О персональных данных», как ей убедиться, что данные деперсонализированы. Это второе.
Третье — это этическая ситуация. Кому принадлежат эти данные? Пользователю? Устройствам, которыми он пользуется? Или компании, которая предоставляет сервисы в этих устройствах? Может, оператору, который предоставляет канал связи? Единой точки зрения до сих пор нет во всём мире, поэтому большинство компаний «варится» преимущественно в собственных данных.
Крупные компании уже активно работают с данными. Есть ли предпосылки к тому, что небольшие игроки тоже начнут встраивать data driven подход в свои бизнес-процессы? Что станет драйвером перехода к data driven культуре?
Data driven подход позволит получать выгоду не только крупным корпорациям, но и МСБ. Переход рынка к совместной работе с данными откроет доступ к большим данным и аналитике для мелких компаний. Например, где открыть кофейню, и почему можно ожидать разный средний чек на двух соседних улицах.
Раньше работа с big data многих отпугивала: нужно большое количество специалистов, доступ к «железу» и сложным инструментам. Но и для программирования раньше были нужны перфокарты, а сейчас вы открываете ноутбук и можете создавать программы, не зная языков программирования. То же самое будет и с рынком инструментов для big data, универсальный инструмент также упростит работу с данными.
Как вы пришли к идее универсального инструмента?
Объединить данные можно на пересечении вероятностных идентификаций: предположить, что это один и тот же человек или группа людей. А как их дальше использовать? Как предоставить кому-то доступ? Мы не нашли ответов на эти вопросы, поэтому решили придумать платформу обмена данными и моделями.
Перед нами стояла грандиозная задача, которую мы уже частично решили: дать специалистам личный кабинет, где они могут работать с объединёнными обезличенными данными, как со своими, без юридических и технологических проблем. Data-специалисты смогут построить на основе этих данных модели, которые принесут дополнительную ценность для бизнеса — не только ВТБ и «Ростелекома», но и наших внешних партнёров.
Как использование объединённых данных должно повлиять на рекламный рынок?
Если говорить в общем, то чем больше данных и чем шире их охват, тем точнее аудиторные сегменты. Благодаря им выше качество продукта, его эффективность и, следовательно, лучше спрос. Компании получат более удобный инструмент, который поможет им не увеличивать штат data-специалистов.
Нужно показать бизнесу, как получать дополнительную выгоду от повышения качества продуктов, а пользователю — что их данные помогают предлагать им более релевантные вещи. Всё вместе это задрайвит сегмент персонализированной рекламы.
Какова роль big data в мире без cookies и рекламных идентификаторов?
Это больная тема для всех игроков рекламного рынка. Переход к Hard ID или большим аудиторным срезам, например, FLoC у Google, конечно, идёт. Мы работаем с внутренними ID — это не явный ID, вроде номера телефона, а предположение, что для вас актуальна тематика, которую вы где-то искали.
Да, телефон и электронная почта помогут сохранить и повысить качество аудиторных сегментов. Законодательно же не очень понятно, как их анонимизировать и передавать, даже если пользователь сам дал на это согласие. Не существует общих внутригрупповых согласий, вы должны подписать явное согласие для конкретной компании. Пока законодательно это не будет решено — многие пойдут в сторону FLoC. В целом же, cookies можно будет заменить объединением данных, условно универсальным инструментом, о котором мы говорили выше.
Рекламный программатик сейчас растёт благодаря технологическим решениям. Как big data решения открывают новые возможности для закупки рекламного инвентаря? Что Platforma может предложить в этой сфере?
Один из основных наших продуктов — это как раз рекламный программатик, мы в нём давно и успешно работаем. Без big data не собрать аудиторные сегменты, которые будут соответствовать задаче клиента; не определить, когда, кому и где показать рекламу. Мы работаем с этим, готовим аудиторные сегменты, помогаем рекламодателям и агентствам улучшать свою рекламу — не только с массовыми сегментами, но и в перформансе.
Например, мы делали кампанию с одним телеканалом, не входящим в первый мультиплекс. Нам нужно было мотивировать аудиторию включить ТВ. Как мы этого добились? С помощью больших данных мы видели, когда пользователи, у которых есть ТВ-приставки, находятся дома, и в это время показывали им сообщение клиента, анонсируя, что прямо сейчас идет на канале. И сработало. Аудитория реально включала канал, а кто-то даже потом возвращался на него, уже без стимуляции через рекламный баннер. Это ещё и история о том, как коммуницировать с потребителем в мире без cookies.
Как вы оцениваете рынок больших данных в России? Какова его специфика по сравнению с общемировым?
Цифры сильно разнятся. Есть оценка Ассоциации больших данных, которая считает, что рынок составляет 10−30 млрд руб, при этом участники рынка ожидают, что к 2024 он вырастет до 100−300 млрд руб. Сейчас Россия занимает небольшую долю мирового рынка. Лидируют США с оценкой около $100 млрд (более 50% мирового рынка), Япония — порядка $10 млрд, и Великобритания — $9,2 млрд.
Нам кажется, чтобы раскрыть потенциал рынка больших данных, России нужно преодолеть пять групп барьеров. Отрасли не хватает специалистов, необходимых для массового внедрения big data. Это мы видим даже на себе: у Platforma открыто много вакансий, и некоторые позиции мы закрываем с большим трудом. Не хватает инфраструктуры, недорогих масштабируемых ресурсов хранения и обработки, поэтому один из наших продуктов — предоставление кабинетов для data-специалистов, где они могут работать с массивом информации.
Росту рынка препятствует ограниченная способность получать доступ к данным, обрабатывать их и обмениваться различными типами данных. Есть сложности в исследовании инноваций, их пока невозможно массово имплементировать в рамках всей экономики: каждый внутри что-то сделал, и непонятно, как это переиспользовать.
Существуют ли риски для персональных данных и приватности в связи ростом популярности big data?
Глобально, и мы, и большинство крупных игроков, использующие big data, работают с обезличенными, анонимизированными массивами данных. Если очень грубо, то мы говорим не о пользователях с фамилией, именем и паспортными данными, а о User ID, кодированных номеров устройств — к ним относится тот же MSISDN (номер мобильного абонента — прим. Sostav). С этой точки зрения, мы глобальных рисков для пользователей не видим.
Если ваш вопрос про утечки данных, то он немного из другой области — из области безопасного хранения, защиты серверов и так далее. И эти направления всем игрокам, работающим с пользовательскими персональными данными, нужно укреплять безотносительно использования больших данных.
Что делать компании, которая хочет внедрить data driven подход в свои бизнес-процессы?
Главное — захотеть работать с данными и четко определить, что вы хотите от этого получить. Если данных у вас нет, или для вас это просто хайп — то, наверное, не стоит в это идти. Но в каждом из направлений, от медицины до рекламы, data driven подход показывает конкретную ценность для организации.
Что нужно для внедрения data driven подхода? Нужно понимать собственный продукт, всю цепочку его построения, продажи и использования — что из этого может улучшить работа с большими данными, на что обратить внимание, какие использовать метрики. Важна автоматизация внутренних процессов, так как именно оцифрованные данные могут стать основой для анализа, построения моделей, прогнозов.
Простой пример. Вокруг нашего офиса много кофеен, и в которой из них взять кофе? Одни из ребят предложили для всех сотрудников нашей компании скидку. Разница с соседними кофейнями — 10 рублей на кружку кофе, но сам подход, когда бизнес повернулся к клиенту и что-то ему предложил, сработал. Ребята для этого узнали, что рядом появилась новая компания, сколько человек в ней работает, и поняли, что если сделать скидку, люди будут ходить к ним, а не к конкурентам. Это не совсем про работу с большими данными, это скорее иллюстрация того, что даже простой анализ даёт ценность. А теперь представьте, какой профит можно получить при глубоком погружении в цифры и данные.
Для маленьких компаний, когда цепочка принятия короче и быстрее, это достаточно просто сделать: вы можете собрать информацию, проанализировать её и принять решение. Компании покрупнее нужно желание бизнеса и драйвер, например, сейчас востребованы люди, которые занимаются трансформацией бизнеса. Но трансформировать бизнес из-за моды неправильно.
Вы должны понимать, зачем вам это надо и что это принесёт, а дальше всё подтверждается цифрами. Был пример, когда аналитики больших данных выявили несоответствие в маркетинге и логистике у одного из производителей порошков: склады были забиты товаром, а в каких-то городах рекламы этого порошка ещё не было. Они смогли сократить расходы и сразу показали прибыль компании.