Не только тексты и картинки: как бизнесу использовать AI, чтобы заработать миллионы

2024-09-13 17:31:58 Время чтения 23 мин 529

Привет! Меня зовут Александр Аксёнов, я сооснователь и CEO Unistory — компании по разработке AI- и web3-продуктов. Мы работаем с 2021 года. За это время успели создать сервисы для клиентов из 20 стран.  

В 2022 году начался хайп вокруг искусственного интеллекта, который подсветил необходимость расширения стека наших услуг до AI. Сначала мы работали только с интеграциями ChatGPT, но постепенно открыли для себя и другие возможности. В этой статье расскажу, где в стартапах можно использовать искусственный интеллект, и поделюсь нашим опытом.

Оценить эффективность рекламы — чтобы не «слить» бюджет

Нейросети можно использовать для оптимизации рекламных кампаний. Есть несколько способов:

  1. Точно определить целевую аудиторию. Так вы сможете выбрать наиболее эффективные каналы и форматы рекламы для каждой группы. Нейросети анализируют данные о поведении и предпочтениях каждого пользователя, и на основе этого создают индивидуальные рекламные объявления. Результат такой кампании будет лучше.
  2. Составить стратегию продвижения. Например, с 2016 года за продвижение легковых автомобилей Volkswagen отвечает компания Blackwood Seven, которая работает c AI. Теперь бренд формирует медиаплан на основе рекомендаций нейросети. В нем прописывается, где и как запускать рекламные объявления, сколько денег на это тратить.

У каждой модели автомобиля своя стратегия: это помогает предсказать, какие инвестиции принесут максимальную отдачу маркетологам. В результате такого сотрудничества продажи модели Volkswagen !Up выросли на 14%, других авто — на целых 20%.

Наш опыт. Один из клиентов пришел с задачей — измерить эффективность размещения рекламных билбордов. Нам предстояло узнать, сколько людей проходит мимо баннеров в разных локациях. Объем данных огромный, поэтому без помощи АI не обошлось.  

Чтобы фиксировать фигуры людей, которые проходят мимо билборда, мы выбрали лидары. Лидар — это камера, которая записывает информацию в виде набора координат, показывает, как далеко от камеры находятся определенные точки. Такая технология используется, например, в автомобилях, чтобы определить безопасную дистанцию до объекта.

Обычное видео не подошло: в европейских странах запрещено снимать прохожих на улице, если это может идентифицировать их личность (закон GDPR). Остановились на лидарах с углом обзора 360°. Именно эта технология позволила фиксировать прохожих в определенной области.  

Для тестирования мы собирали данные с уличной камеры у нашего офиса. Нейронка посчитала, что мимо нас прошло 36 человек за пять минут

Сценарий такой:

  1. Уличные камеры собирают данные о фигурах людей. Вначале эти данные выглядят как текстовый файл с набором координат — не поймет ни человек, ни AI-модель компьютерного зрения.
  2. Софт, который мы разработали специально для этой задачи, превращает координаты в изображения. С этими картинками уже сможет работать искусственный интеллект. С этого момента наш набор координат — объект для компьютерного зрения.
  3. Обученная нейросеть ищет на изображениях фигуры людей и считает их количество. Также нейросеть определит, в какую сторону шли люди — это тоже важно, когда мы хотим посчитать, сколько человек видит конкретный билборд.
  4. Данные по количеству прохожих отправляются на главный сервер.
  5. Главный сервер определяет координаты билборда и фиксирует количество прохожих на разных локациях.
Видео, сделанное для демонстрации работы нейросети. Мы превратили точки координат в картинки, а картинки превратили в видео

С помощью нейросети клиент увидит данные о количестве пешеходов возле каждого рекламного билборда и оценит, сколько времени они стоят рядом. Данные помогут выявить самые проходимые точки и отказаться от локаций с минимальной эффективностью.

Что заказчик получил в результате. У клиента появился собственный инструмент для аналитики и оценки размещений наружной рекламы. До этого получалось только брейнштормить по вопросу наиболее эффективных размещений и полагаться на ту аналитику и цены, которые показывает владелец билбордов. Теперь можно забыть об этом и ориентироваться только на объективные цифры человекопотока.  

Идентифицировать лица — чтобы оценить состояние здоровья

Нейросети могут распознавать лица: они считывают и анализируют уникальные черты человеческого лица, а затем сверяют их с базой. Этот инструмент получится использовать в медицинских клиниках: например, в домах престарелых распознавание лиц помогает отслеживать, принимают ли пациенты лекарства. Медики следят за состоянием пациентов через монитор.

Нейросети способны обнаруживать по лицу генетические заболевания по характерным признакам. Например, синдром Ди Джорджи или синдром Нунан. Еще нейросети помогут оценить общее состояние пациента.

Система искусственного интеллекта научилась ставить диагноз с точностью 91% . AI разбивает лицо на фрагменты и проверяет, насколько они соответствуют заболеваниям из списка

Наш опыт. Кейс, которым мы гордимся, — Dermadex. Задача — сделать мобильное приложение, которое будет ставить дерматологический диагноз по фото проблемной кожи. Так миллионы людей со всего мира смогут узнать о заболевании еще до посещения врача. Чтобы выполнить задачу заказчика, мы решили обучить AI-модель компьютерного зрения и интегрировать ее в приложение.

Вот как работает готовое приложение:

  1. Пользователь с проблемным участком кожи делает его фотографию и загружает в приложение.
  2. Искусственный интеллект ставит первичный диагноз — определяет заболевание и рекомендует пути лечения.
  3. После этого пользователь может записаться на консультацию к профессиональному дерматологу. Консультация может пройти онлайн, либо пользователь может найти подходящего доктора недалеко от себя и сходить на очный прием.
Теперь и правда можем ставить диагноз по аватарке :) Конечно, если на ней есть прыщи!

Мы научили нейросеть находить 60+ разных заболеваний, объединенных в шесть больших групп: акне, псориаз, розацеа, экзема, герпес, витилиго. Теперь приложение выдает диагноз с точностью 90%. Но при одном условии — фото должно быть качественным.

Что заказчик получил в результате. Инструмент привлечения внимания к приложению. Если человеку нужно узнать, что у него за болячка на коже, проще сначала спросить AI и только потом тратить время на общение с доктором. Поэтому, выбирая из десятков телемедицинских приложений, клиент скорее предпочтет Dermadex.

Превратить видео в текст — чтобы получать дополнительные просмотры

Если вы регулярно выпускаете видеоконтент, можете использовать нейросети для генерации «безотходного производства». Есть несколько способов использовать AI:

  1. Переупаковка контента. Суть такая: берете уже готовый материал и меняете его — например, чтобы опубликовать в другой соцсети или СМИ. Так можно делать выжимки или статьи на основе больших обучающих видео. Вы получите дополнительные просмотры, не тратясь на штат копирайтеров или работу с агентством контент-маркетинга.
  2. Транскрибация. Этот способ подойдет, если вы публикуете обучающий контент. Человек сможет закрепить полученные знания с помощью расшифровки лекции, которую автоматически генерирует нейросеть. Например, есть сервис AI Transcription. Он формирует текст с правильными знаками препинания, сохраняет в субтитрах видеоролика.  
Кстати, доказано, что видео с расшифровкой лучше индексируется в поисковых системах (SEO). Об этом говорится в исследовании SafeNet. За месяц страницы с расшифровкой видео поднялись в рейтинге Yahoo и Bing по целевой ключевой фразе на 9-е и 11-е места, хотя изначально не были в топе выдачи.

Наш опыт. Один из наших клиентов — миссионер Бхакти Викаша Свами, личный ученик основателя Международного общества сознания Кришны. Он решил выпускать видео не только на своем YouTube-канале на 100к+ подписчиков, но и на отдельном сайте для последователей и учеников. Кстати, делали сайт тоже мы :)  

Теперь появилась новая задача — дать последователям миссионера доступ к лекциям в разных форматах. Оказалось, что значительная часть аудитории Бхакти предпочитает именно текстовый формат. Чтобы не транскрибировать сотни и тысячи лекций вручную, мы автоматизировали процесс через нейросети.

Так выглядели видео до появления транскрибации: просто длинные лекции без таймлайнов и расшифровок

Для транскрибации видео мы решили использовать специализированную нейросеть Whisper AI. Еще добавили алгоритм, чтобы допиливать сырой текст до идеала после расшифровки. Для этого нейросеть прогоняет его через ChatGPT. Получается качественная расшифровка без ошибок и других косяков.

Нейросети автоматически расшифровали тысячи часовых лекций: только представьте, сколько времени на это понадобилось бы человеку

Чтобы последователям Бхакти Викаша Свами было еще удобнее пользоваться платформой, мы добавили поиск по ключевому слову. Этот инструмент позволяет найти нужный кусок в любой лекции. Например, можно ввести слово «любовь», и алгоритм покажет, в каких видео и в каких конкретно отрезках оно упоминается.

Что заказчик получил в результате. Теперь последователи Бхакти Викаша Свами, которые предпочитают текст, чаще заходят на его видеоплатформу и ищут ответы на свои вопросы. Кроме того, качественная поэтапная AI-транскрибация позволила сэкономить тысячи долларов на ручном труде.

Создать помощника — чтобы оперативно отвечать клиентам

Многие компании используют чат-боты, но они работают по скриптам, поэтому неэффективны. Люди раздражаются от сообщений робота и предпочитают общаться с живыми менеджерами. Наверняка вам приходилось писать в чате поддержки: «Позови оператора!». Если приходилось, тогда вы точно знаете, о чем мы говорим.

Изменить ситуацию может LLM — large language model, большая языковая модель. LLM — это нейросеть, обученная на гигантских объемах текста и способная воспроизводить логичный и связный текст, как если бы его написал живой человек. Самый знаменитый пример LLM — конечно, ChatGPT.

С помощью LLM чат-бот начинает общаться с пользователями на естественном человеческом языке. Он может отвечать на запросы клиентов, как если бы это был настоящий оператор. Консультация такого чат-бота будет логичной, последовательной, а главное — человек получит нужные ответы на свои вопросы.

При этом вы можете «забраковать» много разных вопросов пользователей на этапе настройки чат-бота. Посетители сайта не смогут получить ответы на некоторые вопросы: например, про цены на продукцию конкурентов.

Промсвязьбанк одним из первых на рынке внедрил нейросеть в чат-бот для бизнеса. Теперь можно получать информацию об услугах ПСБ или ответ на любой вопрос, оплачивать выставленные счета прямо в мессенджере.

Наш опыт. Мы несколько раз создавали чат-боты на базе LLM, расскажу об одном из кейсов. Заказчик — производитель и дистрибьютор электромонтажной продукции. На складе тысячи наименований разных товаров, у каждого товара — десятки страниц с описанием, техническими характеристиками и инструкциями. Это огромный объем информации, и живой человек-оператор просто не способен быстро дать пользователю ответы на все его вопросы по продукции.

Именно поэтому понадобилось создать чат-бота, который сможет подключиться к базам данных, мгновенно получить оттуда нужную информацию и дать пользователю корректный ответ. Чтобы решить задачу, мы настроили LLM, обеспечили ее взаимодействие с несколькими API и интегрировали готового бота в платформу заказчика.

Так работает чат-бот: нейросеть моментально обрабатывает запрос и выдает ответ

Благодаря запуску чат-бота пользователи мгновенно получают нужную информацию о продукции компании. Например, пользователь спрашивает «Какие кабели вы производите?». Бот выдает список основных типов кабелей бренда и их характеристики.

Что заказчик получил в результате. Затраты на труд операторов сократились в два раза. Наш чат-бот закрывает запросы 80% покупателей: теперь лишь в одном из пяти случаев пользователи запрашивают помощь оператора.

Проанализировать видеоконтент — чтобы совершенствовать маркетинговые кампании

Думаю, вам не раз приходило в голову: «Как круто было бы, чтобы кто-то посмотрел курс за меня и пересказал самое главное!». С нейросетями это стало возможным. Они могут после просмотра ролика определять ключевые моменты и предоставлять конкретную информацию. К примеру, пошаговые инструкции или ингредиенты рецепта.

Например, недавно Яндекс запустил сервис 300 YA для краткого пересказа текстов и видео. Нейросеть выделяет из большого материала самое главное и присылает выжимку. Вот как это выглядит 👇

Краткий пересказ разбит по тайм-лайнам: можно прочитать, о чем конкретный отрезок видео

Наш опыт. Клиент обратился с задачей — разработать приложение для анализа видеоконтента. Цель — улучшить маркетинговые кампании на стриминговых платформах: получить инсайты о восприятии бренда и найти неочевидные ниши для продвижения.

Мы обучили две модели нейросети: одну — для определения объектов, вторую — для трекинга логотипов, — чтобы определять, какие бренды представлены в кадре. Допустим, вначале ищем внутри видео кадры с кроссовками, а потом определяем, что это именно кроссовки Nike.

Две эти нейросети в связке определяют, в какой момент товары появляются в видео, и к какому бренду они принадлежат. Затем подключается еще одна нейросеть и определяет, какой эмоциональный контекст был в этот момент на видео.

Так можно понять, например, что в двухчасовом обзоре спортивной обуви кроссовки Nike появились на пятнадцатой минуте и были упомянуты в негативном контексте. Теперь маркетологу не нужно изучать контент лично, чтобы получить такую информацию.

Вот как выглядит обнаружение бренда на видео 👇

Нейросеть моментально определяет логотипы: на одежде, обуви и других предметах в кадре

Так клиент может проанализировать потенциальные площадки для размещения рекламы и понять, нужно ли с ними сотрудничать. Например, если блогер подходит по всем параметрам, но у него в видео есть резкие высказывания, от интеграции можно отказаться.

Что заказчик получил в результате. Благодаря AI-анализу клиент будет находить точки роста для размещения рекламы внутри видео.

✅ Выбирать неочевидные каналы и блогеров. Допустим, клиент выпускает кроссовки и покупает рекламу в видео блогеров-миллионников. Но есть и более мелкие инфлюенсеры, которые и так хорошо отзываются о продукте. AI позволяет найти эти слепые зоны и усилить контакт аудитории с продукцией.
✅ Находить точки негатива к продукции. Это возможно благодаря анализу эмоциональной нагрузки видео. При желании клиент может посотрудничать именно с блогерами, которые негативно отзывались о продукции, чтобы сразу отрабатывать возражения аудитории, которые появились у них после просмотра.  
✅ Подстраивать рекламный контент под тренды. Например, если все стали говорить о соперничестве вашей компании с конкурентом, почему бы сразу после видео с рассказом об этой конкуренции не вставить рекламу с трансляцией собственных УТП?

Сгенерировать контент 一 чтобы экономить время и деньги

Нейросети могут генерировать любой контент: от статей для блога и постов для социальных сетей до иллюстраций и рекламных баннеров. Но что делать, если нужно сделать текст сразу с картинками? В этом тоже поможет AI: если использовать систему из связанных нейросетей, получится создавать целые книги с иллюстрациями.

С текстом от нейросети придется немного поработать, отредактировать его. Но это гораздо проще, чем написать статью с нуля

Наш опыт. Заказчик из Румынии пришел к нам с идеей создать сервис генерации детских сказок. Текст, иллюстрации, аудиопрочтение сказки можно генерировать через AI. Главное — «подружить» разные нейросети между собой, чтобы получить полноценный иллюстрированный текст.

Как работает платформа. Пользователь регистрируется на платформе и выбирает тарифный план. Далее он создает сказку, учитывается несколько параметров:

  1. Название. Пользователь указывает его сам, и название влияет на итоговый текст.
  2. Локация. Это может быть волшебный лес, замок принцессы, заколдованное королевство, современный город.
  3. Жанр. Например, приключения, комедия, фантастика.
  4. Персонажи. В этом сервисе героями сказки могут стать, например, ребенок и его любимый хомячок.
  5. Количество глав. Одна глава в сказке — это около 5000 символов. Для обладателей подписки на сервис будет доступно до 10 глав в одной сказке. Большой объем текста стал основным челленджем, который мы решили на уровне промпт-инжиринга.

Смотрите, какие сказки генерирует нейросеть 👇

Например, это история про неожиданных друзей, которые согревают друг друга теплыми разговорами в метель

Герои попадают в неожиданные приключения, заставляя читателя переживать

Истории сохраняются в разделе «Библиотека». Пользователи смогут читать сказки, не покидая платформу, или переводить сгенерированный материал в формат аудиокниги. Можно выбрать голос, который будет читать сказки детям, 一 например, женский или мужской, а еще можно выбрать тембр — милый, строгий, низкий, высокий. Книгу легко выгрузить в PDF или отредактировать по своему желанию.

Что заказчик получил в результате. Готовый стартап. Клиент один раз настроил площадку с нашей помощью с использованием нескольких AI. Теперь, когда площадка запустится, он может просто вкладываться в маркетинг и зарабатывать на подписке.

Пользователям будет доступно несколько видов подписки: на месяц, полгода или год. В зависимости от тарифного плана они смогут генерировать разное количество сказок. Создание аудиокниги на основе вашей истории — отдельная платная опция.


В 2024 году мы планируем выйти на российский рынок и сделать еще больше крутых сервисов с помощью AI. Хотим, чтобы компании понимали, что нейросети — это не просто прикольная фича, а еще и способ увеличить стоимость продукта.

Подробнее о наших проектах рассказываю в своем телеграм-канале. Подписывайтесь, чтобы первыми увидеть, когда мы сделаем новый крышесносный AI-проект :)