В этом году Pro-Vision Communications отмечает важную дату — 25 лет на коммуникационном рынке России. Поэтому над темой для спецпроекта мы думали недолго: просто решили вспомнить самые важные вехи, события и персонажей, определивших настроение этой четверти века, и с помощью Kandinsky 2.1 упаковать их в красивый нейрографический комикс. Что из этого получилось — читайте в материале Sostav.
Нейрохроника одного агентства
Комикс без героя
На старте, после первых попыток «поиграть» с нейросетями, мы приняли самое спорное и сложное решение — делать комикс без героя. Это вынужденная мера: ни одна нейросеть не смогла многократно сгенерировать одного и того же персонажа так, чтобы он был похож на свое предыдущее воплощение. Второго Тони Старка или хотя бы Халка, который, кстати, тоже меняется от серии к серии, не случилось. Поэтому наш комикс стал скорее контекстуальным: лидирующая роль в нем отдана ситуациям и явлениям, а герои лишь иллюстрируют контекст.
Так как история Pro-Vision разворачивалась на фоне резонансных, а местами без преувеличения эпохальных событий, мы намеренно отказались от игры со стилями. Нам было важно отразить настроение определенного времени — богатых нефтегазовых нулевых, рефлексирующих десятых — и почти всегда на такие запросы лучше всего отвечали изображения с фильтром «Без стиля».
Для создания нейрокомикса мы воспользовались Kandinsky 2.1 — обновленной версией нейросети «Сбера», дополнительно обученной на 170 миллионах связок «текст-изображение». Мы искали:
- мультиязычный сервис, который обрабатывает промты на русском языке;
- сервис, созданный в России (видимо, надеялись, что российская генеративная модель лучше передаст специфику российских политики и бизнеса);
- сервис, доступный на разных платформах — как на сайтах, так и в телеграм-боте;
- открытый и бесплатный сервис, который в дальнейшем сможем использовать в работе.
Создание нейрокомикса
Формат комикса предполагает взаимодействие картинки и текста, рассказывает генеральный директор агентства Владимир Виноградов.
Владимир Виноградов, генеральный директор агентства маркетинговых коммуникаций Pro-Vision Communications:
Если бы мы создавали его по классике, без помощи нейросети, то привлекли бы к процессу дизайнера и копирайтера, которые работали бы в паре. В случае же с AI-артом происходит размытие функций: каждый в команде проекта примерил на себя роль райтера, который пишет промт, и дизайнера, ответственного за иллюстрации.
До конца не было понятно, что первично — картинка или текст. Поэтому попробовали работать в такой логике:
- определили основные вехи в истории агентства — их получилось 6;
- поштормили, как можно проиллюстрировать каждую веху;
- перепробовали, наверное, сотни промтов, прежде чем получить содержательный результат;
- выбрали по две картинки на каждый иллюстрируемый период и собрали их в стрипы;
- набросали подписи и выноски;
- отдали на доработку дизайнеру.
Как оказалось, при работе с нейросетью приходится довольно часто импровизировать. Так, на одном из изображений вместо американских президентов на долларах неожиданно появился Волан-де-Морт из «Гарри Поттера». Разумеется, нельзя было оставить этот момент без внимания и не включить его в комикс. И подобных случаев было немало. Некоторые запросы нейросеть понимала до забавного буквально — как, например, «Мир сидит по домам». Другие, напротив, излишне образно: иногда за картинкой с трудом можно было угадать, что хотел сказать автор. Такие изображения пришлось обыгрывать текстом или обращаться к мемам.
Что дорисовал дизайнер:
- выноски;
- логотипы там, где они требовались;
- «упоротого лиса» на экране монитора.
- заблюренные логотипы запрещенных в России социальных сетей;
- геометку с логотипом агентства на Луне.
Для себя мы сформулировали несколько интересных наблюдений:
- промты со словами «в России», «национальное», «федеральное» Kandinsky 2.1 воспроизводит слишком клюквенно и стереотипно: на каждой картинке появляются купола Собора Василия Блаженного, тайга или медведи;
- картинки, созданные по описаниям на русском и английском, все же немного различаются — возможно, из-за многозначности некоторых слов;
- Kandinsky 2.1 грубо работает с компаниями людей: если на картинке несколько человек и/или портреты, в большинстве случаев у них будут общие черты лица;
- чем длиннее и подробнее промт, тем более «нагруженной» и детализированной получится картинка — однако бывает и так, что нейросеть делает акцент только на одном слове из запроса и, например, окрашивает в запрашиваемый зеленый цвет не только стены офиса, но и лица людей;
- бренды и товарные знаки Kandinsky 2.1 распознает, однако, вероятно, не может использовать в готовом изображении — заменяет их узнаваемыми градиентами логотипа или цветами визуального стиля;
- известных публичных личностей нейросеть тоже знает, однако предпочитает не объединять с другими людьми — слишком велик риск получить несколько персонажей с одинаковым узнаваемым лицом.
Рекомендации тем, кто только начинает работать с нейросетями
Несколько основных правил, которые позволят добиться нужного результата при работе с нейросетями:
- формулируйте запрос точно, четко, прописывая детали;
- избегайте сложных слов, заимствований и жаргонизмов — представьте, что просите маленького ребенка нарисовать вам картинку и объясняете, что на ней изобразить;
- если не ограничены во времени — напротив, формулируйте запросы образно: это может сработать в период кризиса идей;
- не ограничивайтесь одной попыткой генерации: один и тот же запрос может дать неожиданный результат на второй, третий или пятый ввод;
- попробуйте передать одну и ту же мысль разными словами;
- при описании людей старайтесь не использовать общие слова типа «друзья» или «коллеги» — лучше конкретизируйте;
- всегда сохраняйте понравившееся изображение: шанс сгенерировать его повторно ничтожно мал;
- подключайте воображение: даже самую спорную картинку, предложенную нейросетью, можно доработать в свою пользу.