Sostav.ru
Москва, ул. Полковая 3 стр.3, офис 120
© Sostav независимый проект брендингового агентства Depot
Использование опубликованных материалов доступно только при указании источника.

Дизайн сайта - Liqium

18+
26.08.2024 в 12:10

Narrators Production запустило цифровых аватаров для бизнеса

Для создания нейро-персон в качестве исходного датасета для ИИ используются длинные видеоролики

По словам представителей креативного агентства Narrators Production (входит в E-Promo Group ) цифровые видеокопии позволяют воспроизводить внешность, жесты, мимику и голос живого человека с высокой точностью. Такие аватары, создаваемые с использованием генеративных нейросетей на основе отснятого видеоматериала, применимы в маркетинге, корпоративной коммуникации, обучении персонала, интерактивных стендах и взаимодействии с подписчиками в социальных сетях. Об этом Sostav рассказала команда агентства.

Для создания аватаров компания использует длинные видеоролики с определенной хореографией и широким спектром эмоций участников в качестве исходного датасета для нейросетей. Во время работы пишется текст, который содержит все необходимые звуки и созвучия, что обеспечивает точное цифровое воспроизведение голоса. Съёмка датасета может занимать несколько часов, после чего данные загружаются в нейросеть. Сгенерированный результат затем корректируется с помощью промптов для достижения максимально естественного звучания.

Владимир Лутаенко, СЕО Narrators Production:

Аватары незаменимы в ситуациях, когда необходимо выпустить контент, но нет времени на запись. Например, в одном из наших кейсов мы сняли видеошоу, и ведущему нужно было назвать данные, которые станут известны только за день до публикации. С помощью аватара можно легко заменить информацию на более актуальную, без необходимости заново организовывать съёмку.

Авторы проекта отмечают, что создание цифровой речи, максимально приближенной к человеческой, является одной из самых сложных задач при работе над аватарами. Согласно внутренним тестам, пользователи, взаимодействующие с цифровыми двойниками, в первую очередь обращают внимание на качество речи, а не на визуальные аспекты. Поэтому при создании цифрового голоса нужно учитывать такие технические детали, как ударения, паузы, эмоциональная окраска речи и уникальные особенности, присущие оригиналу, включая слова-паразиты.

Хронометраж видео с использованием аватаров не ограничен, а в кадре может присутствовать только один персонаж. Ограничений для съёмки и генерации фоновых изображений нет.

Обсудить с другими читателями:
Ваш браузер устарел
На сайте Sostav.ru используются технологии, которые не доступны в вашем браузере, в связи с чем страница может отображаться некорректно.
Чтобы страница отображалась корректно, обновите ваш браузер.