За секунду Google обрабатывает более 99 тыс. поисковых запросов, а в Instagram загружается от тысячи фото — объём данных в интернете растёт с космической скоростью. Данные везде, и это ресурс для бизнеса и маркетинга. Data science обрабатывает, анализирует данные и отвечает на вопросы бизнеса в ритейле, в промышленности, в банкинге и других сферах.
Направление появилась в 70-х годах прошлого века и изучало жизненный цикл данных. В 2010-х компьютеры научилась обрабатывать огромные объёмы информации. Тогда значение науки о данных возросло, дисциплину начали включать в программы мировых университетов.
Сейчас дата сайенс — помощник бизнеса и двигатель инноваций. В статье разберём, что такое Data science, как применяют науку о данных в бизнесе и маркетинге.
Data science — это область знаний, которая изучает и анализирует данные, ищет закономерности для принятия решений на практике. Наука о данных — не совсем наука. Данные — не предмет Data science, а ресурс для получения знаний с методами из других дисциплин: бизнес-аналитики, математики, статистики, программирования, стратегического планирования, системного анализа. Дата сайенс тесно связана с понятиями искусственного интеллекта (AI), машинного обучения (Machine Learning), Big Data и Deep Learning.
Data Science и технологии для работы с данными
Данные Data science получает из интернета, со смартфонов и умных устройств, от специальных датчиков. Другие источники — корпоративные логи, архивы, истории транзакций. Инструменты для data scientists — программное обеспечение, которое обрабатывает, структурирует, анализирует данные и визуализирует их в понятном для конечного пользователя формате.
Дата сайнс смотрит в будущее — строит прогнозы на основе данных. Предсказывает спрос на товары, поведение пользователей в приложении, развитие болезни пациента клиники, прогнозирует климатические катастрофы и другие события.
Data science обрабатывает данные для анализа: организует, агрегирует и оформляет их для непрофессиональных пользователей. Дата сайентист извлекает информацию из массивов обработанных данных, чтобы найти закономерности, построить гипотезы и смоделировать картину будущего.
Как работает Data science по этапам:
Проблематика | Постановка цели и проблемы, которую нужно решить. Какой ответ хотим получить от данных? |
Сбор и обработка данных | Поиск и извлечение необработанных данных в доступных источниках. |
Подготовка данных | Хранение и очистка данных. Убираются пустые поля из баз данных и нерелевантная информация. Необработанные данные преображают в форму, которую возможно анализировать дальше. |
Обработка данных и моделирование | Разбивка по кластерам, моделирование и классификация, поиск закономерностей. Выявляется, что происходило в прошлом (описательная аналитика) и какой вариант развития событий в будущем (предикативная аналитика). Методы статистики, интеллектуального анализа и машинного обучения «заглядывают» в будущее. На этом этапе применяют предписывающую аналитику — моделирование «что, если» и «если…, то что». |
Анализ данных | Используют регрессию, поисковый, подтверждающий, предикативный, подтверждающий качественный и другие виды анализа. |
Оформление данных | Данные показывают конечному пользователю в виде отчётов и визуализации: диаграмм, графиков так далее. |
Принятие решений | На основе данных принимаются решения по бизнес-проблеме. |
Data science отвечает на конкретные вопросы бизнеса — проверяет гипотезы и идеи. Наука о данных:
Беспристрастный ответ на бизнес-вопрос — защита от ошибок и заблуждений. С дата сайнс главное — не авторитет руководителя, а факты.
Data science для бизнеса также:
Data science прогнозирует спрос и отвечает на вопрос, как оптимизировать цепочки поставок. Снижает риски избытка товара при низком спросе и недостатка при больших заказах. На основе данных производство эффективно распределяет ресурсы, контролирует расходы и доходы, находит уязвимые места — причины брака. Предиктивная аналитика покажет, когда оборудование выйдет из строя из-за изнашивания деталей и укажет, когда провести ремонт, чтобы этого не допустить.
Логистика и транспорт
Оптимизация цепочек поставок: сокращение времени доставки, поиск оптимальных маршрутов и снижение расходов на эксплуатацию. Как в промышленности, изучение данных прогнозирует спрос на услуги транспортных компаний. С Data science оптимизируют пространства складов и снижают риски ошибок хранения и перемещения товаров.
В транспорте Data science предсказывает объём пассажиропотоков, загрузку транспортных средств и обеспечивает безопасность — предугадывает поломки и аварии.
Пример. Компания РЖД для прогноза опасных отказов объектов железнодорожного пути внедрила технологии Data science. Алгоритмы моделируют ситуации с более 50 факторами, оценивают состояние путей, техническое состояние составов и указывают на области для срочного ремонта, чтобы избежать аварий и крушения поезда.
Ритейл
В розничной торговле Data science обеспечивает:
Сотовые операторы
Телеком ставит задачу для Data science по персонализации сервисов и продуктов. Данные подсвечивают, что важно для клиента, как оптимизировать пакеты услуг. Также сотовые операторы на основе данных определяют, где лучше размещать салоны связи и сотовые вышки.
В компаниях из сфер телекоммуникаций работают собственные отделы Data science, которые создают цифровые решения не только для внутренних потребностей бизнеса. Пример. Оператор МТС предлагает клиентам сервис для развития туристического потенциала, который анализирует 5000+ метрик для сегментации аудитории.
Банкинг
В банках data scientists исследуют данные для определения кредитного потенциала клиентов. Непогашенные вовремя кредиты — риски для банков. Data science прогнозирует, как поведёт себя клиент в зависимости от ситуации на рынке, оценивает надёжность заёмщика. С данными банки персонализируют сервисы. Алгоритмы определяют интересы пользователя по действиям и предлагают услуги, которые клиент сам и не искал.
Важная задача для Data science — поиск действий мошенников. При операциях на большую сумму система может приостановить транзакцию и попросить подтверждение от клиента. Под подозрение попадут нетипичные покупки, несколько учётных записей с похожими данными.
Недвижимость
В этой сфере изучение данных не ограничивается предложением подходящих вариантов недвижимости покупателю. Data science анализирует документацию объектов: зданий, земельных участков. Данные прогнозируют спрос на недвижимость, цену на заданной территории, а инвесторы решают, в какие объекты стоит вкладываться.
Данные ускоряют поиск жилья для аренды в сервисах. Пример. Airbnb анализирует информацию от пользователей: варианты, которые те просматривали и какие в итоге выбрали. Data science прогнозирует вероятность бронирования в определённых районах города.
Карта с данными вероятности бронирования в Сан-Франциско по данным Airbnb
Оптимизация площадок
Data science покажет, как пользователи ведут себя на интернет-площадках: на сайтах, в приложениях и в соцсетях. На основе данных компания понимает, как упростить процесс покупки, какие элементы добавить, чтобы продукт стал привлекательнее для клиента. Какие функции использовать, чтобы улучшить сервис. Дата сайенс указывает на удачный и неэффективный контент на ресурсах компании: какие материалы дочитывают до конца, а какие пролистывают.
Изучение аудитории и персонализация
Наука о данных детально изучает клиентов: интересы, предпочтительные каналы коммуникации, поведение на интернет-ресурсах и офлайн. Знания об аудитории усиливают персонализацию предложений: компания знает, где клиент лучше реагирует на рекламу, на какие объявления реагирует, как организовать кросс-продажи и допродажи.
С Data science маркетологи детально сегментируют аудиторию по десяткам параметров, чтобы прицельно работать с каждой группой. Например, предлагать товар, когда это актуально. Если знать, когда после покупки у клиента заканчивается продукт (корм для животного, бытовая химия, охлаждающая жидкость для автомобиля и так далее), то реклама продукта в нужный момент — шанс на успех.
Аналитика
C Data science маркетинг получает real-time аналитику и быстро адаптируется к новой ситуации — меняет стратегию. Ускоряется планирование будущих кампаний. Прогнозы на основе данных ответят, как будет происходить ценообразование и какую цену выбрать для сохранения и увеличения объёма продаж.
Оптимизация бюджета
Точная аналитика и предсказуемость поведения потребителей экономит деньги компании. Реклама эффективно отрабатывает бюджет — показывается вовремя и на нужной площадке. С Data science маркетологи знают, какой контент интересен аудитории, и не тратят ресурсы на создание ненужного. Всегда есть данные для прогноза будущих кампаний и оптимизации текущих.
Лояльность и удержание клиентов
Привлечение нового клиента стоит дороже, чем сохранение действующего. Data science укажет на момент, когда клиент теряет активность или прекращает общаться с компанией. Когда компания знает жизненный цикл клиента, то вовремя отправляет персонализированные предложения или полезный контент для удержания.
Data science изучает данные, отвечает на вопросы бизнеса и маркетинга для проверки гипотез, теста идей, запуска новых продуктов и сервисов.
В бизнесе Data science — инструмент для объективного принятия решений вместо интуитивных действий или субъективного опыта. Наука о данных анализирует информацию об аудитории для создания новых сервисов и продуктов. В маркетинге дата сайнс — это оптимизация площадок и бюджетов, персонализация предложений, инструмент для аналитики.
Data scientists работают в промышленности, в логистике, в банкинге, в телекоме и других областях, где возможно собирать и анализировать данные, а потом применять их для бизнес-целей.