Промт для генерации фотографии примеры (с примерами готовых промтов)

В сети можно найти миллионы изображений, сгенерированных нейросетями, и каждое второе из них поражает воображение. Глядя на эти фотореалистичные портреты, фантастические пейзажи и сложные концептуальные арты, обыватель часто думает, что это результат работы некой волшебной кнопки. Нажал – и получил шедевр. На самом же деле за каждым впечатляющим результатом стоит скрупулёзная работа человека, который сумел правильно «объяснить» машине, чего он от неё хочет. Искусственный интеллект – это мощный, но довольно «тупой» инструмент, который нуждается в чётких инструкциях. Но чтобы не разочароваться в результате, стоит разобраться в искусстве составления правильных запросов.

Что такое промт и как он работает?

Задача не из лёгких. Особенно для новичка. Промт (от английского prompt – «побуждение», «команда») — это, по сути, техническое задание для нейросети, написанное на естественном языке. Это текстовое описание того, что вы хотите увидеть на итоговом изображении. Многие считают, что достаточно написать «красивая девушка на пляже», чтобы получить обложку для глянцевого журнала. Но на самом же деле в ответ на такой запрос нейросеть, скорее всего, выдаст нечто усреднённое, шаблонное и лишённое изюминки. Зрелище может быть довольно удручающим.

Дело в том, что алгоритмы не обладают человеческим воображением или чувством прекрасного. Они оперируют гигантскими базами данных, в которых миллионы изображений соотнесены с их текстовыми описаниями. Когда вы вводите запрос, система анализирует его, находит релевантные образы и концепции, а затем пытается их скомбинировать в новое, цельное изображение. Чем детальнее и точнее ваш запрос, тем меньше у машины остаётся «простора для самодеятельности» и тем ближе результат будет к вашей изначальной задумке. Поэтому к составлению промта стоит подходить не как к поэзии, а как к написанию инструкции для невероятно исполнительного, но абсолютно безынициативного стажёра.

Базовая структура: фундамент хорошего запроса

Как же превратить расплывчатую идею в чёткий приказ для ИИ? Нужно разложить всё по полочкам. Хотя строгих правил не существует, и многое зависит от конкретной нейросети (Midjourney, Stable Diffusion, DALL-E), есть общие постулаты, которые работают практически везде. Основа основ – это, конечно же, главный объект или субъект вашей сцены. Кто или что находится в центре внимания? Это может быть «старый мудрый волшебник с длинной седой бородой», «блестящий красный спорткар 1960-х годов» или «одинокое дерево на вершине скалы». Начать стоит именно с этого.

Следующий важнейший компонент – стилистика. В каком стиле вы хотите видеть изображение? Вариантов здесь бесчисленное множество. Можно указать конкретного художника, например, «в стиле Сальвадора Дали» или «картина маслом, как у Ван Гога». Можно задать общее направление: «киберпанк», «фэнтези», «стимпанк», «аниме». А можно определить технический аспект: «фотография, снятая на объектив 85mm», «черно-белый нуарный снимок», «детский рисунок карандашом», «3D-рендер». Этот элемент кардинально меняет восприятие и антураж.

Далее стоит перейти к проработке окружения и деталей. Где происходит действие? Что на фоне? Какое освещение? Все эти нюансы творят чудеса. Сравните «портрет девушки» и «портрет девушки в неоновом свете на фоне ночного Токио». Разница колоссальная. Не стоит скупиться на прилагательные и уточнения: «драматическое утреннее освещение», «мягкие тени», «туманный лес», «мокрая от дождя улица», «сверхдетализация». Львиная доля атмосферы кроется именно в этих мелочах.

Ну и, наконец, не стоит забывать о технических параметрах, которые поддерживают многие нейросети. Обычно они добавляются в конец промта через специальные команды. Это может быть соотношение сторон (например, –ar 16:9 для широкоформатного изображения), уровень стилизации, версия алгоритма или исключение каких-либо элементов из кадра (так называемые «негативные промты»). К слову, негативные промты – спасательный круг, когда ИИ упорно добавляет что-то лишнее. Например, можно попросить нарисовать человека и добавить в негативный промт «уродливый, мутация, лишние пальцы», чтобы снизить вероятность появления анатомических ошибок.

Примеры промтов для разных задач

Теория – это хорошо, но без практики она мертва. Давайте посмотрим, как эти принципы работают в реальной жизни. Допустим, мы хотим получить фотореалистичный портрет. Плохой промт: «старик». Хороший, добротный промт будет звучать так:

extremely detailed portrait photo of a very old wrinkled fisherman with a white beard, smiling, wearing a yellow raincoat, dramatic light, seaside background, shot on a Canon 5D Mark IV with 85mm f/1.8 lens, photorealistic, hyperdetailed

Чувствуете разницу? Здесь есть всё: объект, его состояние, одежда, свет, фон и даже технические детали, имитирующие реальную фототехнику.

А если нужна футуристичная сцена? Вместо банального «город будущего» попробуем что-то более сложное и колоритное. Например:

A sprawling cyberpunk city at night, endless skyscrapers with glowing neon signs in chinese, flying cars leaving light trails, rain-slicked streets reflecting the lights, a lone figure with a glowing umbrella in the foreground, Blade Runner style, cinematic lighting, ultra-wide angle, unreal engine 5 render, octane render, 8k

Такой запрос задаёт не только объекты, но и настроение, цветовую палитру, ракурс и даже отсылает к конкретному визуальному стилю, который нейросеть отлично знает.

Нужно сгенерировать изображение для сайта, например, аппетитный бургер? Откажитесь от простого «бургер на белом фоне». Куда лучше сработает:

professional food photography of a gourmet cheeseburger on a rustic wooden board, melted cheddar cheese dripping, fresh lettuce and tomato, sesame seed bun, blurred restaurant background with bokeh lights, bright vibrant colors, high detail, studio lighting

Этот промт учитывает коммерческие нюансы: профессиональная подача, фон, освещение. Изображение получится сочным и «продающим».

Стоит ли бояться экспериментов?

Безусловно, нет. Составление промта – это не точная наука, а скорее творческий процесс. Разумеется, на первых порах придётся столкнуться с методом проб и ошибок. Не бойтесь смешивать, казалось бы, несовместимые стили. Что получится, если скрестить «стиль Пикассо» и «фотореализм»? Или «древнегреческую статую» и «эстетику киберпанка»? Иногда самые неожиданные комбинации дают по-настояшему впечатляющие, самобытные результаты. Настоящий кладезь для креатива.

К тому же, не стоит воспринимать первый же результат как финальный. Часто хороший промт – это лишь отправная точка. Увидели, что нейросеть неправильно поняла какой-то аспект? Переформулируйте его. Хотите добавить деталь? Просто допишите её. Процесс этот довольно итеративный. Главное – анализировать, что именно в запросе повлияло на тот или иной элемент изображения, и постепенно оттачивать своё мастерство «переводчика» с человеческого языка на машинный.

Теперь у вас есть базовое понимание того, как приручить нейросеть и заставить её рисовать то, что нужно именно вам, а не то, что она сама себе придумала. Это не магия, а технология, подкреплённая вашим вниманием к деталям. Удачи в ваших творческих экспериментах.