«Сбер» обновил нейросеть для генерации изображений Kandinsky до версии 2.2, сообщили Sostav в компании. С ней можно создавать фотореалистичные изображения с более высоким разрешением и изменять соотношение сторон при генерации. Особенно повысилось качество при создании портретов.
Для этого нейросети «скормили» датасет в размере 1,5 млрд пар «текст — изображение», что на 300 млн больше, чем в предыдущей версии — Kandinsky 2.1.
Новая версия модели научилась генерировать стикеры, из которых можно собирать полноценные стикерпаки в Telegram. Также бот Kandinsky 2.2 теперь способен изменять по текстовому описанию отдельные объекты или элементы на изображениях, сохраняя композицию исходной иллюстрации, отмечают в пресс-службе. Новая функция появилась благодаря внедрению в модель специального структурного блока управляемых изменений — ControlNet.
Нейросеть Kandinsky 2.2 понимает запросы на русском и английском языках, умеет рисовать более чем в 20 стилях, смешивать несколько рисунков, стилизовать изображение по текстовому описанию, генерировать изображения, похожие на заданные, дорисовывать недостающие части картинки (inpainting), создавать картины в режиме бесконечного полотна (outpainting).
Как и предыдущая версия, Kandinsky 2.2 находится в открытом доступе и протестировать её можно бесплатно.
Александр Ведяхин, первый заместитель председателя правления «Сбербанка»:
Мы продолжаем совершенствовать нашу нейросеть для создания уникального контента. Новая версия даёт пользователям ещё больше возможностей, при этом она генерирует изображения в ещё лучшем качестве. Нейросеть уже не просто пытается подражать творчеству человека, а способна создавать новые художественные смыслы и интерпретации.
Компания запустила первую версию Kandinsky в 2022 году. Ранее нейрость называлась ruDALL-E. Разработчики Sber AI и SberDevices смогли «существенно улучшить» качество работы модели, дообучив её на 179 млн изображений, снабжённых текстовыми описаниями, с помощью платформы SberCloud ML Space и суперкомпьютера Christofari Neo.