Привет! Меня зовут Александр Аксёнов, я сооснователь и CEO Unistory — компании по разработке AI- и web3-продуктов. Мы работаем с 2021 года. За это время успели создать сервисы для клиентов из 20 стран.
В 2022 году начался хайп вокруг искусственного интеллекта, который подсветил необходимость расширения стека наших услуг до AI. Сначала мы работали только с интеграциями ChatGPT, но постепенно открыли для себя и другие возможности. В этой статье расскажу, где в стартапах можно использовать искусственный интеллект, и поделюсь нашим опытом.
Нейросети можно использовать для оптимизации рекламных кампаний. Есть несколько способов:
У каждой модели автомобиля своя стратегия: это помогает предсказать, какие инвестиции принесут максимальную отдачу маркетологам. В результате такого сотрудничества продажи модели Volkswagen !Up выросли на 14%, других авто — на целых 20%.
Наш опыт. Один из клиентов пришел с задачей — измерить эффективность размещения рекламных билбордов. Нам предстояло узнать, сколько людей проходит мимо баннеров в разных локациях. Объем данных огромный, поэтому без помощи АI не обошлось.
Чтобы фиксировать фигуры людей, которые проходят мимо билборда, мы выбрали лидары. Лидар — это камера, которая записывает информацию в виде набора координат, показывает, как далеко от камеры находятся определенные точки. Такая технология используется, например, в автомобилях, чтобы определить безопасную дистанцию до объекта.
Обычное видео не подошло: в европейских странах запрещено снимать прохожих на улице, если это может идентифицировать их личность (закон GDPR). Остановились на лидарах с углом обзора 360°. Именно эта технология позволила фиксировать прохожих в определенной области.
Сценарий такой:
С помощью нейросети клиент увидит данные о количестве пешеходов возле каждого рекламного билборда и оценит, сколько времени они стоят рядом. Данные помогут выявить самые проходимые точки и отказаться от локаций с минимальной эффективностью.
Что заказчик получил в результате. У клиента появился собственный инструмент для аналитики и оценки размещений наружной рекламы. До этого получалось только брейнштормить по вопросу наиболее эффективных размещений и полагаться на ту аналитику и цены, которые показывает владелец билбордов. Теперь можно забыть об этом и ориентироваться только на объективные цифры человекопотока.
Нейросети могут распознавать лица: они считывают и анализируют уникальные черты человеческого лица, а затем сверяют их с базой. Этот инструмент получится использовать в медицинских клиниках: например, в домах престарелых распознавание лиц помогает отслеживать, принимают ли пациенты лекарства. Медики следят за состоянием пациентов через монитор.
Нейросети способны обнаруживать по лицу генетические заболевания по характерным признакам. Например, синдром Ди Джорджи или синдром Нунан. Еще нейросети помогут оценить общее состояние пациента.
Наш опыт. Кейс, которым мы гордимся, — Dermadex. Задача — сделать мобильное приложение, которое будет ставить дерматологический диагноз по фото проблемной кожи. Так миллионы людей со всего мира смогут узнать о заболевании еще до посещения врача. Чтобы выполнить задачу заказчика, мы решили обучить AI-модель компьютерного зрения и интегрировать ее в приложение.
Вот как работает готовое приложение:
Мы научили нейросеть находить 60+ разных заболеваний, объединенных в шесть больших групп: акне, псориаз, розацеа, экзема, герпес, витилиго. Теперь приложение выдает диагноз с точностью 90%. Но при одном условии — фото должно быть качественным.
Что заказчик получил в результате. Инструмент привлечения внимания к приложению. Если человеку нужно узнать, что у него за болячка на коже, проще сначала спросить AI и только потом тратить время на общение с доктором. Поэтому, выбирая из десятков телемедицинских приложений, клиент скорее предпочтет Dermadex.
Если вы регулярно выпускаете видеоконтент, можете использовать нейросети для генерации «безотходного производства». Есть несколько способов использовать AI:
Кстати, доказано, что видео с расшифровкой лучше индексируется в поисковых системах (SEO). Об этом говорится в исследовании SafeNet. За месяц страницы с расшифровкой видео поднялись в рейтинге Yahoo и Bing по целевой ключевой фразе на 9-е и 11-е места, хотя изначально не были в топе выдачи.
Наш опыт. Один из наших клиентов — миссионер Бхакти Викаша Свами, личный ученик основателя Международного общества сознания Кришны. Он решил выпускать видео не только на своем YouTube-канале на 100к+ подписчиков, но и на отдельном сайте для последователей и учеников. Кстати, делали сайт тоже мы :)
Теперь появилась новая задача — дать последователям миссионера доступ к лекциям в разных форматах. Оказалось, что значительная часть аудитории Бхакти предпочитает именно текстовый формат. Чтобы не транскрибировать сотни и тысячи лекций вручную, мы автоматизировали процесс через нейросети.
Для транскрибации видео мы решили использовать специализированную нейросеть Whisper AI. Еще добавили алгоритм, чтобы допиливать сырой текст до идеала после расшифровки. Для этого нейросеть прогоняет его через ChatGPT. Получается качественная расшифровка без ошибок и других косяков.
Чтобы последователям Бхакти Викаша Свами было еще удобнее пользоваться платформой, мы добавили поиск по ключевому слову. Этот инструмент позволяет найти нужный кусок в любой лекции. Например, можно ввести слово «любовь», и алгоритм покажет, в каких видео и в каких конкретно отрезках оно упоминается.
Что заказчик получил в результате. Теперь последователи Бхакти Викаша Свами, которые предпочитают текст, чаще заходят на его видеоплатформу и ищут ответы на свои вопросы. Кроме того, качественная поэтапная AI-транскрибация позволила сэкономить тысячи долларов на ручном труде.
Многие компании используют чат-боты, но они работают по скриптам, поэтому неэффективны. Люди раздражаются от сообщений робота и предпочитают общаться с живыми менеджерами. Наверняка вам приходилось писать в чате поддержки: «Позови оператора!». Если приходилось, тогда вы точно знаете, о чем мы говорим.
Изменить ситуацию может LLM — large language model, большая языковая модель. LLM — это нейросеть, обученная на гигантских объемах текста и способная воспроизводить логичный и связный текст, как если бы его написал живой человек. Самый знаменитый пример LLM — конечно, ChatGPT.
С помощью LLM чат-бот начинает общаться с пользователями на естественном человеческом языке. Он может отвечать на запросы клиентов, как если бы это был настоящий оператор. Консультация такого чат-бота будет логичной, последовательной, а главное — человек получит нужные ответы на свои вопросы.
При этом вы можете «забраковать» много разных вопросов пользователей на этапе настройки чат-бота. Посетители сайта не смогут получить ответы на некоторые вопросы: например, про цены на продукцию конкурентов.
Промсвязьбанк одним из первых на рынке внедрил нейросеть в чат-бот для бизнеса. Теперь можно получать информацию об услугах ПСБ или ответ на любой вопрос, оплачивать выставленные счета прямо в мессенджере.
Наш опыт. Мы несколько раз создавали чат-боты на базе LLM, расскажу об одном из кейсов. Заказчик — производитель и дистрибьютор электромонтажной продукции. На складе тысячи наименований разных товаров, у каждого товара — десятки страниц с описанием, техническими характеристиками и инструкциями. Это огромный объем информации, и живой человек-оператор просто не способен быстро дать пользователю ответы на все его вопросы по продукции.
Именно поэтому понадобилось создать чат-бота, который сможет подключиться к базам данных, мгновенно получить оттуда нужную информацию и дать пользователю корректный ответ. Чтобы решить задачу, мы настроили LLM, обеспечили ее взаимодействие с несколькими API и интегрировали готового бота в платформу заказчика.
Благодаря запуску чат-бота пользователи мгновенно получают нужную информацию о продукции компании. Например, пользователь спрашивает «Какие кабели вы производите?». Бот выдает список основных типов кабелей бренда и их характеристики.
Что заказчик получил в результате. Затраты на труд операторов сократились в два раза. Наш чат-бот закрывает запросы 80% покупателей: теперь лишь в одном из пяти случаев пользователи запрашивают помощь оператора.
Думаю, вам не раз приходило в голову: «Как круто было бы, чтобы кто-то посмотрел курс за меня и пересказал самое главное!». С нейросетями это стало возможным. Они могут после просмотра ролика определять ключевые моменты и предоставлять конкретную информацию. К примеру, пошаговые инструкции или ингредиенты рецепта.
Например, недавно Яндекс запустил сервис 300 YA для краткого пересказа текстов и видео. Нейросеть выделяет из большого материала самое главное и присылает выжимку. Вот как это выглядит 👇
Наш опыт. Клиент обратился с задачей — разработать приложение для анализа видеоконтента. Цель — улучшить маркетинговые кампании на стриминговых платформах: получить инсайты о восприятии бренда и найти неочевидные ниши для продвижения.
Мы обучили две модели нейросети: одну — для определения объектов, вторую — для трекинга логотипов, — чтобы определять, какие бренды представлены в кадре. Допустим, вначале ищем внутри видео кадры с кроссовками, а потом определяем, что это именно кроссовки Nike.
Две эти нейросети в связке определяют, в какой момент товары появляются в видео, и к какому бренду они принадлежат. Затем подключается еще одна нейросеть и определяет, какой эмоциональный контекст был в этот момент на видео.
Так можно понять, например, что в двухчасовом обзоре спортивной обуви кроссовки Nike появились на пятнадцатой минуте и были упомянуты в негативном контексте. Теперь маркетологу не нужно изучать контент лично, чтобы получить такую информацию.
Вот как выглядит обнаружение бренда на видео 👇
Так клиент может проанализировать потенциальные площадки для размещения рекламы и понять, нужно ли с ними сотрудничать. Например, если блогер подходит по всем параметрам, но у него в видео есть резкие высказывания, от интеграции можно отказаться.
Что заказчик получил в результате. Благодаря AI-анализу клиент будет находить точки роста для размещения рекламы внутри видео.
✅ Выбирать неочевидные каналы и блогеров. Допустим, клиент выпускает кроссовки и покупает рекламу в видео блогеров-миллионников. Но есть и более мелкие инфлюенсеры, которые и так хорошо отзываются о продукте. AI позволяет найти эти слепые зоны и усилить контакт аудитории с продукцией.
✅ Находить точки негатива к продукции. Это возможно благодаря анализу эмоциональной нагрузки видео. При желании клиент может посотрудничать именно с блогерами, которые негативно отзывались о продукции, чтобы сразу отрабатывать возражения аудитории, которые появились у них после просмотра.
✅ Подстраивать рекламный контент под тренды. Например, если все стали говорить о соперничестве вашей компании с конкурентом, почему бы сразу после видео с рассказом об этой конкуренции не вставить рекламу с трансляцией собственных УТП?
Нейросети могут генерировать любой контент: от статей для блога и постов для социальных сетей до иллюстраций и рекламных баннеров. Но что делать, если нужно сделать текст сразу с картинками? В этом тоже поможет AI: если использовать систему из связанных нейросетей, получится создавать целые книги с иллюстрациями.
Наш опыт. Заказчик из Румынии пришел к нам с идеей создать сервис генерации детских сказок. Текст, иллюстрации, аудиопрочтение сказки можно генерировать через AI. Главное — «подружить» разные нейросети между собой, чтобы получить полноценный иллюстрированный текст.
Как работает платформа. Пользователь регистрируется на платформе и выбирает тарифный план. Далее он создает сказку, учитывается несколько параметров:
Смотрите, какие сказки генерирует нейросеть 👇
Например, это история про неожиданных друзей, которые согревают друг друга теплыми разговорами в метель
Герои попадают в неожиданные приключения, заставляя читателя переживать
Истории сохраняются в разделе «Библиотека». Пользователи смогут читать сказки, не покидая платформу, или переводить сгенерированный материал в формат аудиокниги. Можно выбрать голос, который будет читать сказки детям, 一 например, женский или мужской, а еще можно выбрать тембр — милый, строгий, низкий, высокий. Книгу легко выгрузить в PDF или отредактировать по своему желанию.
Что заказчик получил в результате. Готовый стартап. Клиент один раз настроил площадку с нашей помощью с использованием нескольких AI. Теперь, когда площадка запустится, он может просто вкладываться в маркетинг и зарабатывать на подписке.
Пользователям будет доступно несколько видов подписки: на месяц, полгода или год. В зависимости от тарифного плана они смогут генерировать разное количество сказок. Создание аудиокниги на основе вашей истории — отдельная платная опция.
В 2024 году мы планируем выйти на российский рынок и сделать еще больше крутых сервисов с помощью AI. Хотим, чтобы компании понимали, что нейросети — это не просто прикольная фича, а еще и способ увеличить стоимость продукта.
Подробнее о наших проектах рассказываю в своем телеграм-канале. Подписывайтесь, чтобы первыми увидеть, когда мы сделаем новый крышесносный AI-проект :)