Во время IT-конференции HighLoad++ технический директор «ВКонтакте» Александр Тоболь представил функцию дипфейка, которая позволит авторам контента примерить лица знаменитостей для создания роликов. В основе технологии — нейросети, которые обрабатывают видео практически в режиме реального времени, что позволит создавать свыше 200 тыс. видео с дипфейками ежедневно.
На выбор доступны лица Ольги Бузовой, Клавы Коки, Егора Крида, NILETTO, Дани Милохина и Кати Адушкиной. Видео с дипфейком можно опубликовать в «VK Клипах» и в «VK Видео».
Сгенерированные ролики помечаются специальной вотермаркой при экспорте на внешние площадки, чтобы зрители могли отличить дипфейк-видео от роликов с реальными звёздами. Все обрабатываемые видео также проходят автоматическую проверку на соответствие правилам публикации контента в соцсети, а пользователи получают дополнительные уведомления о том, что дипфейк-видео носят исключительно развлекательный характер.
Александр Тоболь, технический директор «ВКонтакте», «VK Видео» и «VK Клипов»:
Наши технологии несут в себе ряд инноваций. Так, например, большинство дипфейк-решений работают по принципу независимой обработки каждого кадра, поэтому даже минимальные изменения в положении и освещении лица на видео часто приводят к дрожанию и бликам. Мы же с командой при разработке технологии дипфейка во «ВКонтакте» решили обрабатывать видео как последовательность кадров с помощью рекуррентной нейронной сети — это позволило не только устранить артефакты, присущие решениям с покадровой обработкой, но и использовать возможности нейронной сети более оптимальным образом, кратно ускорив генерацию дипфейков.
В будущем разработчики планируют поддержать обработку видео в режиме реального времени и интегрировать технологию в другие сервисы, например в «VK Звонки». Новая механика призвана вдохновить пользователей на эксперименты с видеоконтентом, отметил Тоболь.