Сбербанк показал новую версию нейросети Kandinsky 3.0

Сбербанк представил новую версию нейросети Kandinsky 3.0. Модель лучше понимает текстовые запросы и за несколько секунд создаёт реалистичные изображения, в том числе на тему культуры России. Об этом говорится в сообщении банка.

Нейросеть научилась создавать ещё более фотореалистичные изображения, генерировать полноценные художественные картины и арты со скетчами. Отмечается, что модель работает с запросами из широкого списка тем и «способна реализовать любой полёт фантазии».

Сбербанк показал новую версию нейросети Kandinsky 3.0

«Kandinsky 3.0 лучше предыдущих версий знает элементы отечественного культурного кода. Так, значительно улучшилось качество генерации российских и советских известных личностей и персонажей, архитектурных достопримечательностей, объектов культуры и элементов народного искусства России, например гжельской росписи», — пояснили в компании.

Кроме того, у новой модели улучшена функция редактирования изображений и возможность их дорисовки в режиме бесконечного полотна.

Kandinsky 3.0 создаёт изображения с высоким разрешением — 1024×1024 пикселей. При этом нейросеть может синтезировать картинки с выбранным соотношением сторон.

Для обучения нейросети разработчики использовали обновлённый датасет в размере 1,5 млрд пар «текст — изображение», содержащий данные, которые прошли многоэтапные процедуры фильтрации.

Пользователи Kandinsky 3.0 могут создавать видеоролики по текстовому описанию в режиме анимации. По одному запросу генерируется видео длиной до четырёх секунд c выбранным эффектом анимации.

Также Сбер представил нейросеть Kandinsky Video — генеративную модель для создания полноценных видеороликов по текстовому описанию. Модель генерирует видеоряд длительностью до восьми секунд с частотой 30 кадров в секунду.

Архитектура Kandinsky Video состоит из двух ключевых блоков. Первый отвечает за создание ключевых кадров, из которых складывается структура сюжета видео. Второй — за генерацию интерполяционных кадров, которые позволяют достичь плавности движений в финальном видео.

В основе обоих блоков лежит модель Kandinsky 3.0.

Новости

Digital

Медиа

Креатив

Маркетинг

Бизнес

Общество

Спецпроекты

Sostav.Школа

Лекторий

Лицо рынка

Мнение рынка

Bookchain

Экспертиза

Итоги года 2025

Карьера

Выбор редакции

Рейтинг медиаагентств 2025

ТОП-30 крупнейших рекламодателей России 2025

Подкасты

Видео

Реклама на сайте

Контакты

Гайдлайны

Каталог компаний

Рейтинги

Бизнес-блоги

Блоги

Sostav в соцсетях

Сбербанк показал новую версию нейросети Kandinsky 3.0

Компания также представила нейросеть Kandinsky Video для создания полноценных видеороликов по текстовому описанию