Как составить запрос к нейросети, рисующей изображения

2023-04-11 17:02:37 Время чтения 6 мин 7010

На российском рынке появилось сразу два новых инструмента для генерирования изображений по описанию — Kandinsky 2.1 от Сбера и Шедеврум от Яндекса. Через Kandinsky 2.1 за сутки сгенерировали уже более 1,3 млн изображений. Кроме них, можно получить доступ и к зарубежным решениям — Midjourney, Stable Diffusion и DALL-E 2. Делимся полезными советами, как написать запрос к таким нейросетям, чтобы с большей вероятностью получить желаемый результат.

Язык

Для составления запроса выберите английский язык — его нейросети понимают лучше. Определите, что вы будете генерировать: объект или абстракцию.

Объект

К объекту лучше добавить описание, но деталей не должно быть слишком много, иначе они могут перегрузить нейросеть. Описанием может выступать действие (сидит, лежит, спит), настроение (грустный, добрый, злой) и цвет. 

Midjourney, запрос two happy marketers sitting at a table with macbooks

Не стесняйтесь использовать синонимы, так нейросеть лучше поймет, какое настроение вы хотите создать. Если вы хотите нарисовать несколько объектов или персонажей, то укажите точное число. Если вам нужно много персонажей, то лучше напишите — толпа.  Помните: чем больше объектов на изображении, тем меньше детализация.

Абстракция

Нейросети умеют генерировать абстрактные понятия, например, время, судьба или счастье. Но лучше не задавать концепции, в которых нейросеть должна предложить определенное видение, например, оптимистичное будущее. Она лучше справится с запросом — киберпанк-город с голограммами.

DALL-E 2, запрос cyberpunk city with holograms

От чего стоит отказаться

При создании изображения лучше отказаться от слов-отрицаний: не, без, исключая, кроме. Также нейросети плохо передают множество различных объектов и точные объекты, например, внешний вид какого-либо города.

Стилистика

В описание можно добавить любой стиль, например, готика, сюрреализм, а также формат — постер, картина. Стили можно смешивать, главное, чтобы они не взаимоисключали друг друга. Также изображение можно создать в стиле какого-то творца, например, Ван Гога или Уэса Андерсона. 

Kandinsky 2.1, запрос city of future in Wes Anderson style

В качестве референса нейросети можно дать картинку. Это может быть, как реальное фото, так и сгенерированное изображение. Также нейросети можно предложить несколько изображений одновременно.

Надстройки 

В запрос можно добавить различные надстройки, которые изменят формат изображения. Например, соотношение сторон в нейросетях обычно квадратное — по умолчанию 1:1. Если вам нужно горизонтальное изображение, поставьте в конце запроса к Midjourney --ar 4:3 (или --ar 5:3 для более узкой горизонтальной картинки), а если вертикальное --ar 2:3.

Midjourney, запрос cyberpunk city with holograms --ar 5:3

Если добавить к запросу --s, можно регулировать уровень стилизации. Диапазон от 0 до 60 тыс. Еще один параметр — фильтрация слов. При использовании фильтра --no нейросеть будет избегать указанных объектов.

Надеемся, что наши рекомендации будут полезны пользователям нейросетей, которые хотят улучшить свои навыки в создании изображений, — и помогут выбрать правильные параметры, избежать ошибок и оценить качество полученных картинок.

Midjourney, запрос happy neural network user --ar 5:3