В контексте искусственного интеллекта и обработки естественного языка, промпт — это вводное предложение или набор предложений, которые используются для того, чтобы направить модель на выполнение определенной задачи. Это текстовое описание того, что мы хотим получить в результате. И чем более детальным будет это описание, тем больше результат будет соответствовать тому, что нам надо. Об этом Sostav рассказала дизайнер трейд-маркетингового агентства «АЛИДИ Продвижение» Анна Анашина.
Введение в промпты
Рассмотрим на примере имиджа. Допустим, мы хотим получить изображение матового металлического огнетушителя, для использования его в Telegram. На первом месте идет описание того объекта, который будет основным на нашем имидже. Далее идет описание материала, цвета, света, положения в кадре, описание фона и окружения, стилистики изображения. В финале прописываем соотношения сторон для картинки. В Midjourney по умолчанию идет 1:1, то есть квадрат, нам это подходит.
Пример создания промпта, анализ и корректировка результатов
Сейчас покажу, как я веду работу над конкретным запросом. Итак, начнем вот с такого промпта для этой задачи.
Это не совсем тот результат. Добавляем в начало описательной части «brushed stainless steel». И в конец промпта дописываем «серый фон» и добавляем эффектов.
Как мы видим, изображения получаются более единообразные. Это показатель того, что мы на верном пути. Вообще, хороший промпт от неподходящего отличить очень легко. Если вы, прогоняя один и тот же промпт несколько раз, получаете схожие единообразные изображения — значит все получилось и «шалость удалась».
Вернемся к нашему огнетушителю — в изображении мне не нравится, что отсутствуют некоторые элементы конструкции.
Оптимизация промпта
На этот раз хотелось уже наверняка попасть в цель. Для этого один и тот же эффект описываем разными словами несколько раз. Тут действует тот же прием, что и в общении: когда мы не понимаем собеседника, то можем использовать выражение «объясни то же самое, но другими словами». С нейросетями так же, только мы используем в промпте все варианты описания одного и того же обьекта и задачи.
Итак, смотрим, что добавилось — это просьба сделать конструкцию более высокоточной, описание самой конструкции огнетушителя. Также я прописала мягкие тени, малую глубину резкости и точнее описала, какой хочу свет. В конце дублировала пожелание получить высокоточные элементы.
Опять же действует то же правило, что и в общении. Если хочешь, чтобы собеседник запомнил, о чем ты говорил, повтори несколько раз — в написании промптов действует та же схема.
Итак, у меня получилось, именно то, что я хотела. Теперь, используя эту конструкцию промпта, можно делать, например, огнетушители из разных материалов, меняя описание материала.
Адаптация промптов для видео и текстов
В работе над видео и текстами правила те же. Естественно, в видео мы можем прописывать изменение композиции в кадре, ближе-дальше для каких-то элементов и др. Для текстов — это стилистика текста
Таким образом, следуя описанной структуре, можно легко и быстро получить желаемый результат. Также можно использовать библиотеки промптов или сайты со стилистиками для ИИ.
Использование разных нейросетей
В мире генеративного искусственного интеллекта существует множество моделей, каждая из которых может быть оптимизирована для определенных задач:
- Изображения: помимо Midjourney, существуют другие AI-модели, такие как DALL-E, Stable Diffusion и др. Они могут отличаться в своих подходах к обработке изображений, стилям и возможностям кастомизации.
- Текст: для генерации текстов можно использовать GPT от OpenAI, Gemini от Google, YandexGPT, GigaChat и другие. Эти модели хорошо работают с разным стилем текста, но требования к промптам могут слегка отличаться.
- Видео: генерация видео с помощью AI пока остается более сложной задачей, но модели, такие как RunwayML. Genmo и Pika Labs, уже делают в этом направлении уверенные шаги.
Особенности работы и нюансы
- Детализация задания: чем подробнее и точнее вы опишите желаемое, тем выше вероятность получить удовлетворяющий результат.
- Контекст и вариативность: помните, что обученные модели нуждаются в контексте и вариативности ввода для лучшего понимания задачи.
- Интерактивная корректировка: поскольку AI может неправильно интерпретировать сложные запросы, важно корректировать промпты на основе получаемых результатов.