В нашей истории создания и философии Interpool мы переносимся в мир известной франшизы, в котором общество поглотила страшная болезнь. Из-за хаотичности и перегруженного инфо-клаттера, к которому мозг человека не успевает адаптироваться, люди потеряли всякую осознанность восприятия жизни и вещей вокруг. Рекламные материалы не органично упакованы для подачи и восприятия людей. Их внимания не хватает на то, чтобы поглощать и усваивать удобоваримо растущий поток неорганизованной информации.
В центре событий собирательный образ работника нашей компании — Вео. Он начинает замечать что-то подозрительное вокруг себя и хочет выбраться из этого круговорота и спасти человечество. А ты готов узнать правду?
«Парадогма внимания»
AI каждый раз генерирует персонажа заново
Изначально мы определили для себя визуальное описание для каждого действующего лица комикса.
В описаниях мы использовали маркеры, чтобы AI мог опираться на популярные референсы при создании:
В итоге у нас получилось нечто среднее между всеми маркерами, что нас по итогу устроило.
Двигаясь по сюжету, мы пытались ставить персонажей в различные ситуации и изображать на их лице эмоции. Для этого использовали одно и то же описание внутри команды Midjourney + описание ситуации или эмоции.
Проблемой здесь стало то, что AI каждый раз генерирует персонажа заново, и почти всегда они абсолютно не похожи друг на друга.
Здесь мы начали использовать подходящие изображения персонажей (как референс-ссылка внутри команды для MJ) и описывать ситуацию, эмоцию и окружение.
Здесь важным стал тот момент, что для персонажа необходимо прописывать ключевые детали, которые MJ опускает при создании — это красные линзы очков и очки как таковые. Для этого, после ссылки на референс, мы везде добавляли man in red lense glasses, что решило проблему.
Пример, как изменился персонаж при использовании команды:
При создании диалога между таксистом и главным героем мы столкнулись с другой проблемой — это ракурсы. Описания side view или backside view никак не помогали делу, поэтому к первичному описанию backside view in a car, мы добавили view from backside passenger, после чего мы сохранили схожесть персонажа на всех кадрах и получили нужный нам ракурс.
Пример неудачной и удачной реализации:
Пример промптов
Помимо MJ, мы использовали ChatGPT plugin Photorealistic для составления базовых промптов, и в ряде случаев он помогал.
Сначала были сложности с тем, что картинки получались хорошие, но более реалистичные, чем того требует комикс. Или же в другой графической манере, несмотря на указание Manga style.
Два подобных примера и промпт ниже.
Пример запроса:
A medium-shot photograph capturing a narrow, desolate alley as the backdrop. A mysterious figure in a black cloak with a hood, evoking the image of a benevolent Nazgul, is seen leaning back against a wall, facing away from the camera. The face is hidden, and the silhouette of the hood and cloak is beautifully defined. Medium: Digital Photography. Style: Manga-inspired dynamic graphic comics without dialogue clouds. Lighting: Low-key, with a soft ambient glow highlighting the intricate folds and silhouette of the cloak and hood. Colors: Dark, moody tones with a focus on the blackness of the cloak. Composition: Shot with a Canon EOS 5D Mark IV DSLR camera, EF 85 mm f/1.8 USM lens, Resolution 30.4 megapixels, ISO sensitivity: 1600, Shutter speed 1/60 second, employing a shallow depth-of-field to focus solely on the figure's silhouette and the narrow alley. --ar 16:9 --v 5.1 --style raw --s 750
Еще одна сложность — отрисовка двух разных персонажей на одном кадре была проблемой, так как MJ скрещивал их характеристики, одежду, и наличие референсов тут не помогало.
Пример смешения:
И даже одного персонажа он никак не мог усадить в одну сторону, чтобы в другую мы могли поставить собеседника героя.
Поэтому решили сначала создать само пространство, в которое потом встраивали уже отдельно созданных и вырезанных героев.
В итоге после четырех недель работы набегами в «свободное» время, получили неординарный опыт сторителлинга собственной «сказки» и философии; узнали о более подробных настройках параметров MJ, приоритеты промптов и итоговую выдачу их как результат у MJ; научились гибко подходить к решению в выражении определенных сцен.
И, конечно, преисполнились в своем познании. А также замахнулись на вторую часть комикса. Спасибо Sostav-у за такой интересный челлендж!