Sostav.ru
Москва, ул. Полковая 3 стр.3, офис 120
© Sostav независимый проект брендингового агентства Depot
Использование опубликованных материалов доступно только при указании источника.

Дизайн сайта - Liqium

18+
25.10.2024 в 15:50

Анна Анашина, «АЛИДИ Продвижение»: алгоритмы воображения

Как улучшить работу с нейросетями: настройка промптов для идеального результата

3

В контексте искусственного интеллекта и обработки естественного языка, промпт — это вводное предложение или набор предложений, которые используются для того, чтобы направить модель на выполнение определенной задачи. Это текстовое описание того, что мы хотим получить в результате. И чем более детальным будет это описание, тем больше результат будет соответствовать тому, что нам надо. Об этом Sostav рассказала дизайнер трейд-маркетингового агентства «АЛИДИ Продвижение» Анна Анашина.

Введение в промпты

Рассмотрим на примере имиджа. Допустим, мы хотим получить изображение матового металлического огнетушителя, для использования его в Telegram. На первом месте идет описание того объекта, который будет основным на нашем имидже. Далее идет описание материала, цвета, света, положения в кадре, описание фона и окружения, стилистики изображения. В финале прописываем соотношения сторон для картинки. В Midjourney по умолчанию идет 1:1, то есть квадрат, нам это подходит.

Пример создания промпта, анализ и корректировка результатов

Сейчас покажу, как я веду работу над конкретным запросом. Итак, начнем вот с такого промпта для этой задачи.

Вот что получилось

Это не совсем тот результат. Добавляем в начало описательной части «brushed stainless steel». И в конец промпта дописываем «серый фон» и добавляем эффектов.

Получаем вот такой результат

Как мы видим, изображения получаются более единообразные. Это показатель того, что мы на верном пути. Вообще, хороший промпт от неподходящего отличить очень легко. Если вы, прогоняя один и тот же промпт несколько раз, получаете схожие единообразные изображения — значит все получилось и «шалость удалась».

Вернемся к нашему огнетушителю — в изображении мне не нравится, что отсутствуют некоторые элементы конструкции.

Оптимизация промпта

На этот раз хотелось уже наверняка попасть в цель. Для этого один и тот же эффект описываем разными словами несколько раз. Тут действует тот же прием, что и в общении: когда мы не понимаем собеседника, то можем использовать выражение «объясни то же самое, но другими словами». С нейросетями так же, только мы используем в промпте все варианты описания одного и того же обьекта и задачи.

Итак, смотрим, что добавилось — это просьба сделать конструкцию более высокоточной, описание самой конструкции огнетушителя. Также я прописала мягкие тени, малую глубину резкости и точнее описала, какой хочу свет. В конце дублировала пожелание получить высокоточные элементы.

Опять же действует то же правило, что и в общении. Если хочешь, чтобы собеседник запомнил, о чем ты говорил, повтори несколько раз — в написании промптов действует та же схема.

Итак, у меня получилось, именно то, что я хотела. Теперь, используя эту конструкцию промпта, можно делать, например, огнетушители из разных материалов, меняя описание материала.

Адаптация промптов для видео и текстов

В работе над видео и текстами правила те же. Естественно, в видео мы можем прописывать изменение композиции в кадре, ближе-дальше для каких-то элементов и др. Для текстов — это стилистика текста и т. д. То есть учитываем особенности формата. Стоит избегать аллегорий, какого-то высокохудожественного языка, так как это делает результат более непредсказуемым.

Таким образом, следуя описанной структуре, можно легко и быстро получить желаемый результат. Также можно использовать библиотеки промптов или сайты со стилистиками для ИИ.

Использование разных нейросетей

В мире генеративного искусственного интеллекта существует множество моделей, каждая из которых может быть оптимизирована для определенных задач:

  • Изображения: помимо Midjourney, существуют другие AI-модели, такие как DALL-E, Stable Diffusion и др. Они могут отличаться в своих подходах к обработке изображений, стилям и возможностям кастомизации.
  • Текст: для генерации текстов можно использовать GPT от OpenAI, Gemini от Google, YandexGPT, GigaChat и другие. Эти модели хорошо работают с разным стилем текста, но требования к промптам могут слегка отличаться.
  • Видео: генерация видео с помощью AI пока остается более сложной задачей, но модели, такие как RunwayML. Genmo и Pika Labs, уже делают в этом направлении уверенные шаги.

Особенности работы и нюансы

  • Детализация задания: чем подробнее и точнее вы опишите желаемое, тем выше вероятность получить удовлетворяющий результат.
  • Контекст и вариативность: помните, что обученные модели нуждаются в контексте и вариативности ввода для лучшего понимания задачи.
  • Интерактивная корректировка: поскольку AI может неправильно интерпретировать сложные запросы, важно корректировать промпты на основе получаемых результатов.
Обсудить с другими читателями:
Ваш браузер устарел
На сайте Sostav.ru используются технологии, которые не доступны в вашем браузере, в связи с чем страница может отображаться некорректно.
Чтобы страница отображалась корректно, обновите ваш браузер.