На создание комикса у команды iConText Group ушла неделя. Решили выбрать классическую нуарную стилистику, для которой характерны мрачная атмосфера и контрастные сочетания цветов. За основу взяли пятерку непобедимых героев — ассоциация с пятью диджитал-агентствами, входящими в iConText Group. Поэтому работу над созданием комикса начали именно с поиска персонажей, которые бы олицетворяли компании внутри группы. C помощью нейросетей разработали сценарий и приступили к генерации картинок. Оказалось, всё намного сложнее, чем на первый взгляд. Но результат того стоил.
Непобедимая пятерка iConText Group
Агентства группы стали персонажами комикса
Первым делом авторы описали персонажей, олицетворяющих агентства iConText Group , и с учетом этого попросили ChatGPT создать сюжет для комикса, а именно — рассказать, как герои встретились и почему решили объединиться.
Каких героев взяли за основу
Главными героями выступали животные с характерными чертами, у каждого была своя профессия, которая соотносилась с деятельностью компании.
- icontext — леопард-фокусник. Создает магию для клиентов, используя различные инструменты диджитал-маркетинга для достижения их целей: проводит аналитику, разрабатывает performance-стратегии и управляет рекламой.
- Zen Mobile Agency — японский кот-ниндзя. Знает все о мобильной рекламе и продвижении мобильных продуктов и маневрирует между телефонами, словно Джеки Чан на пике своей карьеры.
- CPAExchange — енот-доставщик. Доставляет конверсии до клиентов и использует для этого все каналы трафика: контекстную рекламу, социальные и тизерные сети, email и прочие.
- Registratura — сокол-программист. Занимается performance-маркетингом и использует передовые технологии, чтобы открыть все двери в мире бизнеса и увеличить конверсию клиентам.
- iSEO — собака-детектив. Раскрывает тайны поисковых систем, знает все о поисковой оптимизации и умеет вывести любой сайт на вершину поисковых запросов.
В итоге нейросеть сгенерировала около семи текстов. Чтобы комикс получился интереснее, авторы несколько раз просили ChatGPT изменить язык повествования: убрать официозность, упростить, сделать смешнее.
После попросили ввести в сюжет антигероев, добавили кульминацию и развязку. Когда сюжет был готов, поставили задачу нейросети расписать комикс в виде диалогов. Однако диалоги получались слишком длинные, поэтому несколько раз приходилось их сокращать с помощью ChatGPT, делать более емкими.
Чем острее сюжет, тем динамичнее разметка
Следующий шаг — генерация изображений на основе созданных диалогов. Для реализации задуманного выбрали Midjourney.
Вдохновившись дюжиной комиксов и проанализировав особенности построения сетки для каждого сюжета, команда сделала выводы: чем острее сюжет, тем динамичнее должна выглядеть разметка на изображении.
И наоборот: чем спокойнее сюжет, тем меньше динамики.
Стоит отметить, что команда долго искала нужную стилистику. Самое сложное было сохранить ее на изображениях на протяжении всего комикса.
Пример промта: A kind Japanese ninja cat with a red bandage on his forehead, many different poses in the style of a superhero in one picture, on a white background in the style of Marvel comics.
Финальный промт: Cartoon superhero ninja cat, in the style of noir comic art, dark and gritty cityscapes, blue and red, ultrafine detail, marvel comics, weathercore, innovative page design --ar 16:9.
Команда разделила генерацию на несколько этапов. Сначала создавали основных персонажей. Подробные описания главных героев позволили из раза в раз генерировать похожих животных (проблема с изображениями людей заключается в том, что нейросеть каждый раз добавляет разные лица, если только это не известные личности).
Более подробно разберем генерацию каждого персонажа. Сначала команда описывала самого героя, потом стилистику изображения, а потом техническую настройку для выведения рисунка
Пример промта: a cartoon of a detective dog in a suit in action, in the style of noir comic art, dark and gritty cityscapes, blue and red, ultrafine detail, marvel comics, weathercore, innovative page design --ar 16:9.
На основе понравившейся картинки команда iConText Group генерировала в Midjourney новое изображение. Например, просили в такой же стилистике представить этого же персонажа, но в другой позе. По аналогии работали с каждым персонажем.
После отрисовки героев необходимо было сгенерировать фон для каждого сюжета. Для этого команда использовала новую функцию фотошопа — Generative Fill, которая на основе маленькой части изображения дорисовывает оставшуюся область в той же стилистике. Первое, что сделали, — вырезали каждого персонажа с фона, по умолчанию созданного Midjourney. Потом отдельно сгенерировали в нейросети фон, подходящий под настроение каждого сюжета.
Пример работы с Generative Fill:
На последнем этапе команда в Figma собирала разные изображения (героев, фоны) в единую картинку. Сверху дополнительно наложили шум для поддержания единой стилистики.
Неудачные попытки
ChatGPT далеко не с первого раза выдал текст, который бы отражал деятельность агентств, входящих в группу. Даже после подробных описаний нейросеть долго не могла логически сопоставить персонажа и компанию, так как не погружена в специфику конкретного бизнеса.
Что касается работы с Midjourney, чтобы добиться желаемого результата, команда сгенерировала порядка 500 изображений: на разных картинках нейросеть не сохраняла общую стилистику комикса.
Если просто закидывать в Midjourney какой-то референс, без уточняющего промта, нейросеть выдает странный результат.
Рекомендации по работе с нейросетями от iConText Group
Лайфхак 1. Если добавить в запрос «many different poses, on a white background», нейросеть выдаст одного персонажа в разных позах на одной картинке, с белым бэкграундом.
Лайфхак 2. Настройка «--ar» позволяет задать для изображения нужные пропорции. По умолчанию нейросеть генерирует квадрат. Если же задать параметр «--ar 16:9», то вы получите горизонтальные иллюстрации. И, наоборот, если указать «--ar 9:16», то вертикальные. К слову, такие картинки отлично подходят для формата сторис.
Лайфхак 3. Закидывайте референсы с нужными запросами. Это позволяет быстрее добиться желаемого результата.
Лайфхак 4. Не забывайте заходить в Community Feed. Вводите ключевые слова и выбирайте из готового, иногда это сильно экономит время.
Если вам нужна уникальная генерация, комьюнити поможет вам сформировать промт. Найдите стилистику изображения, которая вам подходит, и заберите описание.
Какой главный инсайт?
Нейросети — отличный инструмент, который помогает экономить время, поэтому не нужно их бояться. Но отдавать всё им на откуп еще рано. Искусственный интеллект не может быть на 100% вовлечен в процесс, погружен в специфику бизнеса. Так, команде iConText Group пришлось дорисовывать свет, соединять фон с персонажем. Да и сам сюжет ChatGPT смог сгенерировать только на основании подробных описаний (читай: указаний).
Поэтому главный вывод, который можно сделать: без ручного труда и идей, которые выдает человеческий разум, пока не обойтись. И это здорово! Но никто не отменяет возможность тестирования нейросетей. Если хотите с ними работать, регулярно следите за обновлениями и экспериментируйте.
Состав творческой группы
Главный редактор iConText Group: Полина Михайлова
Арт-директор iConText Group: Рустам Бродников
Графический дизайнер iConText Group: Мария Матвеева