«Сбер» представил бесплатную бета-версию нейросети Kandinsky Video 1.1. Она предназначена для создания коротких роликов по текстовому описанию и изображению. Об этом Sostav сообщили в компании.
Новая версия ИИ-модели позволяет «оживлять» статичную картинку. Формат сгенерированного видео —непрерывная сцена с движением и объекта, и фона.
Модель генерирует видеоряд продолжительностью до шести секунд с частотой восемь и 32 кадра в секунду. При этом ролик можно создавать в разных форматах — 16:9, 9:16 или 1:1. В новой версии модели также можно контролировать динамику генерируемого видео с помощью специального параметра motion score.
Новую ИИ-модель разрабатывали и обучали исследователи Sber AI при поддержке учёных из Института искусственного интеллекта AIRI на объединённом датасете Sber AI и компании SberDevices.
«Сбер» показал нейросеть Kandinsky Video — генеративную модель для создания полноценных видеороликов по текстовому описанию — в ноябре 2023 года. Тогда отмечалось, что её архитектура состоит из двух ключевых блоков. В основе обоих лежит модель Kandinsky 3.0.