Две системы искусственного интеллекта, подобно близнецам, разлученным при рождении, «воспитывались» в принципиально разной информационной среде. Одна «потребляла» контент телеканала «Россия-1», вторая — независимого канала «Дождь».
Разработчики из ISD Group, The App Solutions совместно с рекламным агентством «Восход» решили наглядно показать разницу мировосприятия, сформированного разными СМИ.
С чего всё началось?
Проект начался с вопроса: «Можно ли с помощью машинного обучения наглядно и правдиво показать разницу между новостной информацией на телеканале «Дождь» и такой же информацией на государственном телеканале?»
Наталья Синдеева, генеральный директор телеканала «Дождь»:
Нас часто противопоставляют федеральным каналам, и мы сами всегда считали, что сильно от них отличаемся. Поэтому когда нам предложили поучаствовать в этом шуточном эксперименте, нам стало интересно, хотя и было немного тревожно. Ведь это мы чувствуем разницу, а на уровне нейросетей могло бы оказаться, что мы говорим на том же языке. В общем, мы не понимали, что получится в итоге, но процесс в любом случае затягивает.
Сложности проекта
Нейросетью в 2019 уже никого не удивишь, однако большинство из них — это чат-боты, которые, хоть и готовы вступить в диалог с пользователем, но всё же работают по заранее заготовленным скриптам. Эта схема задумке не соответствовала.
К тому же, оба интеллекта должны были «смотреть» телевизор — воспринимать звук и транслировать его в текст, с которым уже можно работать.
Работа креативной и технической команды
Чтобы обеспечить чистому разуму «просмотр ТВ», разработчики заранее отобрали передачи телеканалов на релевантные темы (приоритет: политика, экономика и жизнь в стране) и воспользовались сервисом Google Speech-to-Text. С помощью него система определяла язык передачи, идентифицировала количество говорящих персон, разбивала текст на абзацы и записывала результаты в базу данных для дальнейшей обработки.
Команда проекта:
Конечно, при таком подходе возможны ошибки распознавания текста, потому в ответах иногда встречаются некоторые неточности.
Самый главный компонент системы — Trained Neural Network — алгоритм, наученный правильно выстраивать взаимосвязи между словами и темами из базы знаний.
Эксперименты креаторов и разработчиков проводились на технологиях Question Answering Model (Q&A), ODQA, Word Embeddings.
Система не была идеальной и иногда давала сбои по разным причинам. Иногда из-за «глупых» вопросов, иногда из-за отсутствия необходимой тематики в базе знаний, иногда банально глючила.
Решив дообучить систему лучше понимать вопросы, разработчики привлекли в эксперимент обычных людей, которые должны были задавать свои вопросы системе. Она в свою очередь автоматически пыталась определить тематику вопроса. Пользователь либо соглашался с тематикой, либо отмечал, что вопрос относится к другой теме.
По окончании тестов была получена достаточно сложная модель нейросети, которую можно использовать для практически любого набора данных. Важно понимать, что ответ всегда зависит от их объёма.
Команда проекта:
В нашем проекте тем всего три, и существующая база ограничена только информацией из передач за последние полгода. По сути, мы имеем дело с юными неокрепшими умами.
У них нет ответов на все вопросы. Но и те ответы, что есть, наглядно показывают разницу. Разницу между мировоззрениями тех, кто смотрит государственные телеканалы, и тех, кто смотрит «Дождь».
Результаты
Сначала нейросети, как признаются сами создатели, были похожи на Шарикова в операционной профессора Преображенского, но со временем обучились отвечать на вопросы пользователей осмысленно и, что ещё важнее, интересно. Хотя, если честно, пока все равно ответы на многие вопросы или остаются загадкой, или не совсем адекватны запросу. Впрочем, это же «дети», а детям можно всё простить.
Искусственный интеллект здесь действительно напоминает ребенка, который начал познавать мир, черпая информацию не из мультиков, а из серьезных новостных программ. Подобно детям, нейросети изобретают ответы на основе того, что знают, иногда демонстрируя разницу между лексикой государственного канала и независимого СМИ.
Каждый может поговорить с кибер-умами и проголосовать за того, чьи суждения больше нравятся.
Андрей Губайдуллин, креативный директор РА «Восход»:
Оба интеллекта могут сами анализировать информацию и выстраивать связи между смыслами. У них нет предыдущего опыта. Нет сторонних факторов, которые влияют на восприятие информации. Они как будто потребляют информацию в первозданном виде, с чистого листа.
Представьте, если бы мы взяли двух близнецов, которые ничего не знают о мире, и сформировали бы их мировоззрение. В одном случае — с помощью Дождя, в другом — с помощью телеканала Россия-1. И теперь они отвечают на вопросы используя только информацию, которую «видели» за время эксперимента. А если дети чего-то не знают, то начинают фантазировать. И это самое интересное.
Телеканал «Россия-1» проект не прокомментировал.
Состав творческой группы:
Телеканал «Дождь» (клиент)
Синдеева Наталья, генеральный директор
Гуляева Светлана, исполнительный продюсер
«Восход» (креатив)
Креативный директор: Андрей Губайдуллин
Копирайтер: Антон Рожин, Дарья Овечкина
Креативный диджитал-директор: Дмитрий Маслаков
Арт-директор: Анна Маслякова
Моушн дизайнер: Лиля Загидуллина
Техлид: Василий Цыкин
Аккаунт-менеджер: Елизавета Ларионова
ISD Group GmbH (разработка)
Director of Creative Technology: Viktor Shkurba
Head of Development: Andrew Sergeyev
Head of Data & Analytics: Svitlana Taborskykh
Creative Technology Head: Andrii Mishchenko
UX & Strategy Head: Michael Traverse
Creative Technologists: Kateryna Malashok, Dmytro Yatsyna
Producers: Helena Shyta, Dariia Andriushchenko
The App Solutions (разработка)
CTO: Mykola Slobodian
Lead Architect: Oleksandr Bushkovskyi
Data Scientists: Illia Vasylevskyi, Andrii Shokotko
Project Manager: Oleksii Shevchuk