Как написать промт для генерации фото (с примерами готовых промтов)

В сети полно впечатляющих изображений, созданных нейросетями: от фотореалистичных портретов несуществующих людей до грандиозных фантастических пейзажей. Глядя на них, многие пользователи тоже грёзят о том, чтобы творить визуальные чудеса, просто описывая их словами. Однако первая же попытка часто приводит к разочарованию — вместо продуманной композиции на экране возникает какая-то невнятная каша из образов, а персонажи обладают шестью пальцами. Вся суть в том, что нейросеть — это не волшебник, а скрупулёзный исполнитель, которому нужно предельно точное техническое задание. Но чтобы не разочароваться в результате, нужно освоить искусство составления запросов, или, как их называют, промтов.

Что такое промт и почему это важно?

В представлении многих обывателей промт — это простое описание желаемого, вроде «красивая девушка на пляже». Технически это так, но с таким подходом впечатляющего результата не добиться. На самом деле, добротный промт для генерации фото — это подробная инструкция для искусственного интеллекта. Он включает в себя не только описание центрального объекта, но и указания по стилю, освещению, композиции, ракурсу и даже техническим параметрам съёмки, как если бы вы давали задание профессиональному фотографу. Именно от его точности и глубины зависит львиная доля успеха. Сложно ли это? Вовсе нет. Процесс не сложный, но кропотливый и требует внимания к деталям.

Анатомия идеального запроса

Задача не из лёгких, но её можно разложить по полочкам. Чтобы нейросеть вас поняла, запрос стоит строить из нескольких логических блоков. Во-первых, это главный объект или субъект сцены. Нужно максимально подробно описать, кто или что находится в центре нашего изображения. Например, не просто «мужчина», а «пожилой седовласый мужчина с густой бородой и добрыми морщинами вокруг глаз, одетый в твидовый пиджак». Детализация здесь творит чудеса.

Далее следует окружение или фон. Где находится наш персонаж? В старинной библиотеке с высокими стеллажами, заставленными книгами, или на вершине заснежённой горы на фоне закатного неба? Антураж задаёт настроение и контекст, поэтому не стоит им пренебрегать. Отдельно стоит упомянуть стиль, в котором вы хотите видеть финальное изображение. Это может быть что угодно: фотореализм, картина маслом в стиле импрессионистов, аниме, киберпанк или даже готический рисунок углём. Указание конкретного стиля или даже имени художника (например, «in the style of Van Gogh») — мощнейший инструмент для получения нужной атмосферы.

Ну и, наконец, технические детали. Этот блок часто упускают новички, а ведь именно он придаёт изображению профессиональный вид. Здесь можно указать тип камеры (например, DSLR), объектив (скажем, 85mm f/1.8 для портретов с размытым фоном), ракурс съёмки и, конечно же, освещение. Последний пункт — настоящий кладезь возможностей. Одно дело — «дневной свет», и совсем другое — «мягкий свет золотого часа», «драматическое боковое освещение» или «неоновое свечение ночного города».

Какие детали действительно меняют игру?

Когда базовые постулаты освоены, можно окунуться в нюансы, которые приковывают внимание зрителя. Что насчёт ракурса? Простой запрос «портрет женщины» скорее всего выдаст стандартный снимок анфас. Но стоит добавить «снимок с нижнего ракурса» (low-angle shot), и мы получим величественный, монументальный образ. Или, наоборот, «вид сверху» (top-down view) создаст совершенно иную перспективу. Эксперименты с ракурсами — довольно простой способ сделать картинку динамичнее и интереснее.

С освещением дело обстоит ещё сложнее и одновременно увлекательнее. Формулировка «cinematic lighting» (кинематографичное освещение) — это уже шаг вперёд. Она заставляет нейросеть имитировать сложные схемы света, используемые в большом кино, добавляя глубину и драматизм. А если хочется чего-то конкретного, можно прописать «rim light» (контурный свет), который красиво очертит силуэт объекта, отделив его от фона. К слову, не стоит забывать и про цветовую палитру. Можно попросить нейросеть использовать «тёплые осенние тона» или «холодную сине-зелёную гамму», чтобы сразу задать нужную эмоцию.

Готовые примеры: от простого к сложному

Теория — это хорошо, но без практики она мертва. Давайте посмотрим на конкретные примеры. Предположим, наша цель — создать фотореалистичный портрет. Вместо «девушка с рыжими волосами» стоит написать нечто более проработанное. Вот добротный пример промта:

Фотореалистичный портрет молодой женщины 25 лет с веснушками и длинными вьющимися рыжими волосами, зелёные глаза, лёгкая улыбка, одета в изумрудный свитер крупной вязки. Мягкий свет из окна, фон — уютная комната с книжными полками. Снято на камеру DSLR, объектив 85mm, f/1.8, cinematic lighting.

В таком запросе есть всё: описание модели, одежды, фона, освещения и технических параметров.

А если мы хотим создать нечто фантастическое? Например, затерянный город в джунглях. Простой запрос даст плоский и скучный результат. А вот более глубокий промт:

Грандиозный затерянный город древней цивилизации в густых джунглях, каменные храмы, поросшие мхом и лианами, водопады, стекающие по стенам. Атмосфера таинственности и приключений. Утренний туман, лучи солнца пробиваются сквозь листву. Цифровая живопись, высокая детализация, в стиле работ студии Ghibli, эпичная композиция.

Здесь мы указали не только объект и окружение, но и настроение, погодные условия и конкретный художественный стиль, что кардинально меняет дело.

Ну и, конечно же, стилизация под конкретный жанр. Допустим, нам нужен киберпанк-антураж. Запрос может выглядеть так:

Киборг-детектив в длинном кожаном плаще стоит на мокрой от дождя улице ночного мегаполиса. Вокруг неоновые вывески на разных языках, летающие автомобили в небе. Мрачная, нуарная атмосфера. Фотореализм, высокая детализация, сине-фиолетовая цветовая гамма, отражения в лужах, кинематографичный свет.

Каждый элемент этого промта работает на создание целостного и колоритного образа.

Типичные подводные камни

На пути к созданию шедевров неизбежно всплывут ошибки. Одна из самых распространённых — излишняя краткость. Нейросеть не умеет читать мысли, и запрос «космический корабль» может породить как изящный истребитель, так и громоздкий грузовик. Не скупитесь на прилагательные и уточнения. Другая крайность — перегруженность противоречиями. Не стоит просить «минималистичный детализированный пейзаж» или «радостного грустного клоуна». Это собьёт алгоритм с толку.

Ещё один нюанс — так называемые негативные промты. Большинство современных сервисов позволяют указывать, чего на изображении быть НЕ должно. Это спасательный круг в борьбе с извечной проблемой нейросетей — анатомией. Если вы устали от шестипалых рук или трёх ног, смело используйте поле для негативного промта, прописав туда «уродливые руки, лишние пальцы, мутация, плохое качество». Ну, а ложка дёгтя в том, что даже с самыми скрупулёзными запросами результат не всегда предсказуем. Иногда приходится сгенерировать десяток вариантов, прежде чем наткнёшься на тот самый.

Впрочем, в этой непредсказуемости и кроется часть магии. Не стоит бояться экспериментов, смешивать стили, добавлять неожиданные детали и нарушать правила. Иногда самые впечатляющие результаты рождаются из случайных и безумных идей. Удачи в ваших творческих махинациях.