По словам представителей креативного агентства Narrators Production (входит в E-Promo Group ) цифровые видеокопии позволяют воспроизводить внешность, жесты, мимику и голос живого человека с высокой точностью. Такие аватары, создаваемые с использованием генеративных нейросетей на основе отснятого видеоматериала, применимы в маркетинге, корпоративной коммуникации, обучении персонала, интерактивных стендах и взаимодействии с подписчиками в социальных сетях. Об этом Sostav рассказала команда агентства.
Для создания аватаров компания использует длинные видеоролики с определенной хореографией и широким спектром эмоций участников в качестве исходного датасета для нейросетей. Во время работы пишется текст, который содержит все необходимые звуки и созвучия, что обеспечивает точное цифровое воспроизведение голоса. Съёмка датасета может занимать несколько часов, после чего данные загружаются в нейросеть. Сгенерированный результат затем корректируется с помощью промптов для достижения максимально естественного звучания.
Владимир Лутаенко, СЕО Narrators Production:
Аватары незаменимы в ситуациях, когда необходимо выпустить контент, но нет времени на запись. Например, в одном из наших кейсов мы сняли видеошоу, и ведущему нужно было назвать данные, которые станут известны только за день до публикации. С помощью аватара можно легко заменить информацию на более актуальную, без необходимости заново организовывать съёмку.
Авторы проекта отмечают, что создание цифровой речи, максимально приближенной к человеческой, является одной из самых сложных задач при работе над аватарами. Согласно внутренним тестам, пользователи, взаимодействующие с цифровыми двойниками, в первую очередь обращают внимание на качество речи, а не на визуальные аспекты. Поэтому при создании цифрового голоса нужно учитывать такие технические детали, как ударения, паузы, эмоциональная окраска речи и уникальные особенности, присущие оригиналу, включая слова-паразиты.
Хронометраж видео с использованием аватаров не ограничен, а в кадре может присутствовать только один персонаж. Ограничений для съёмки и генерации фоновых изображений нет.