На создание комикса у команды Mobio ушло около недели. Сначала специалисты дорабатывали сценарий, а после приступили к генерации картинок. Решили выбрать классический сеттинг с достаточно популярной рисовкой. В связи с некоторыми особенностями добиться полностью удовлетворительного результата команде не удалось, так как, по словам представителя агентства, сейчас нейросети не дают возможности скейлить нужных персонажей в другие позы или эмоции в полном спектре.
Invasion
Сценарий от ChatGPT и иллюстрации от Midjourney
Для начала авторы попросили ChatGPT написать несколько разных вариантов концептов от лица сценариста, где были бы основные теги: «вторжение инопланетян», «маркетинг», «спасение земли маркетологами». Бот выдал несколько вариантов, один из которых пришелся команде по душе. Тогда команда попросила искусственный интеллект создать полноценный сценарий для комикса с диалогами. Затем с помощью Figma специалисты разложили реплики и действия на страницы и блоки.
Создавать изображения решили в Midjourney. С помощью нейросети команда искала подходящую стилистику на примере главной страницы. Изначально у авторов уже было представление, как должен выглядеть будущий комикс, что облегчило процесс выбора среди множества вариантов. Нужный вариант нашелся по запросу:
planet earth in space, comic book style --ar 3:2
Команда агентства Mobio:
Мы увеличили изображение и выяснили, какой у него seed (переменная в Midjourney, используемая как отправная точка для создания изображения — прим. Sostav). А значит, если мы будем добавлять ко всем остальным запросам этот seed, то они будут получаться в той же стилитике, что нам нужно.
Однако команда столкнулась со сложностью: при неудовлетворительном результате сгенерировать другие варианты изображений уже не получалось, так как картинки имели разные seed. Пришлось работать с самим запросом.
Например:
Interior of the ship, captain's bridge, full-length hologram of a girl, comic book style --ar 3:2 --seed 3932545112
Этот запрос не дал нужного результата, а вот другой помог получить уже что-то подходящее:
an alien hologram on an alien spaceship, comic book style --ar 3:2 --seed 3932545112
Но, все равно получившийся результат авторов не устроил, поэтому команда попробовала добавить картинку-референс к запросу, и вот тогда результат получился, что надо.
Иллюстрации от нейросетей решили заверстать в Figma. Некоторые кадры совмещали из нескольких разных, удаляя фон у предыдущих картинок. Для этого тоже воспользовались сервисом с искусственным интеллектом — removebg. Он позволил ускорить процесс технической обтравки (Обтравка — термин, означающий удаление наименее значимых частей изображения, чтобы акцентировать внимание на главном объекте — прим. Sostav) и дал больше времени сфокусироваться на творческом процессе.
Неудачные попытки
Естественно, были и не совсем удачные попытки. Например для одного из кадров было необходимо получить крупные мужские губы, которые что-то говорят:
close-up on the lips, the man says, comic book style --ar 3:2 --seed 3932545112
Или нам надо было получить изображение, где пальцы крупно стучат по клавиатуре:
close-up, fingers tapping the computer keyboard, comic book style --ar 3:2 --seed 3932545112
Рекомендации по работе с нейросетями от Mobio
Сейчас все настолько стремительно развивается, что все, написанное выше, может стать неактуальным в ближайшее время. Поэтому тем, кто хочет работать с нейросетями, надо постоянно экспериментировать, смотреть за другими экспериментами на Youtube или читать статьи.
Глобально нейросети пока не могут дать полный доступ к контролю над конечным результатом. Это ограничение толкает на новые подходы и поиски решений. Однако хочется, чтобы такие минимальные воздействия как изменение температурного баланса или изменение мимики можно было делать сразу внутри нейросети, не прибегая к сторонним сервисам и приложениям.