Какой промт для генерации изображения (с примерами готовых промтов)

В сети представлено множество нейросетей, способных по текстовому описанию создавать настоящие визуальные шедевры. Многие грезят о том, чтобы одним щелчком мыши воплотить в жизнь свои самые смелые фантазии: от портрета в стиле киберпанк до эпического пейзажа несуществующей планеты. Однако первые попытки часто приводят к разочарованию – вместо грандиозной картины получается нечто странное и нелепое, отдалённо напоминающее задумку. Но чтобы не ошибиться и не разочароваться в возможностях искусственного интеллекта, нужно сперва освоить искусство составления правильного запроса – промта.

Промт: что это такое на самом деле?

Задача не из лёгких. В представлении многих обывателей промт – это просто набор слов, описывающих желаемое. Отчасти это так, но лишь отчасти. На самом деле, хороший промт куда больше похож на подробный технический заказ или даже на рецепт для шеф-повара, где каждый ингредиент и его пропорции играют решающую роль. Что же это такое? По сути, промт — это инструкция для нейросети, максимально детализированная и однозначная. Искусственный интеллект ведь не обладает человеческой интуицией или культурным багажом в привычном нам смысле. Он не догадается, что под «красивой девушкой» вы подразумевали рыжеволосую эльфийку в доспехах на фоне заката. Для него это слишком абстрактно. Поэтому ваша задача — разложить свою идею на атомы и скормить их алгоритму в понятной для него форме.

Из чего состоит хороший запрос?

С чего начинается выбор? С определения фундаментальных составляющих, которые превратят кашу из слов в рабочий инструмент. Во-первых, это главный объект или субъект изображения. Стоит начать именно с него. Это может быть что угодно: «старый мудрый кот», «космический корабль», «викторианский особняк». Важно сформулировать это максимально чётко. Не просто «человек», а «седовласый старик с бородой и в очках». Это основа, скелет, на который будет нанизываться всё остальное. Без добротного фундамента вся конструкция рискует рассыпаться.

Далее следует не менее важный пласт – стилистика и эстетика. Здесь открывается настоящее поле для экспериментов. Вы можете указать конкретный художественный стиль, например, «в стиле импрессионизма», «картина маслом», «акварельный рисунок» или даже «в стиле Тима Бёртона». Кроме того, можно задать общее настроение: «мрачная готическая атмосфера», «яркий солнечный день», «неоновый свет». К слову, довольно часто используют имена конкретных художников (например, «в стиле Ивана Айвазовского»), чтобы нейросеть точнее поняла, какого визуального языка от неё ждут. Это же правило касается и фотографов, и даже кинорежиссёров.

Особый интерес вызывает детализация окружения и контекста. Ведь объект редко существует в вакууме. Его нужно поместить в определённый антураж. Где находится ваш седовласый старик? «Сидит в кожаном кресле у камина в старой библиотеке». Чем он занят? «Читает толстую книгу в кожаном переплёте». Какие ещё детали важны? «На столе стоит чашка дымящегося чая, за окном идёт дождь». Чем больше таких мелких, но значимых подробностей вы добавите, тем более живой и проработанной получится итоговая картинка. Не стоит забывать и про такие параметры, как освещение («драматический боковой свет», «мягкий утренний свет») и ракурс («снято с нижнего ракурса», «крупный план лица»).

Ну и, конечно же, технические параметры, которые часто упускают из виду. Это своего рода «служебные» команды, которые помогают нейросети лучше откалибровать результат. Сюда относится, например, соотношение сторон изображения (команда --ar 16:9 для горизонтального или --ar 2:3 для вертикального кадра в Midjourney). Также существует очень полезный инструмент — негативный промт. Это перечисление того, чего на изображении быть НЕ должно. Например, если вы генерируете портрет, стоит добавить в негативный промт «уродливые руки, лишние пальцы, мутация», чтобы избежать распространённых ошибок нейросетей.

Практические примеры: от простого к сложному

Давайте разложим всё по полочкам на конкретных примерах. Предположим, мы хотим получить изображение кота. Самый базовый и, откровенно говоря, плохой запрос будет выглядеть так:

a cat

Нейросеть сгенерирует случайного кота в случайной позе и стиле. Результат будет абсолютно непредсказуемым.

А вот так запрос будет выглядеть, если мы добавим немного антуража и конкретики. Средний уровень проработки:

Рыжий пушистый мейн-кун спит на стопке старинных книг, мягкий свет из окна, уютная атмосфера, фотография, высокая детализация

Здесь уже есть всё необходимое: чётко определён объект (рыжий мейн-кун), его действие (спит), окружение (стопка книг), освещение (мягкий свет) и стилистика (фотография с высокой детализацией). Шансы получить добротный результат возрастают многократно.

Ну а теперь пример сложного, скрупулёзного промта для получения конкретного, выверенного кадра.

Кинематографичный кадр, старый ржавый робот-садовник заботливо поливает единственный красный цветок, пробившийся сквозь асфальт в постапокалиптическом разрушенном городе, на фоне видны руины небоскрёбов, закатное солнце, драматическое освещение, стиль фильма “Бегущий по лезвию”, 8k, фотореализм –ar 16:9 –no text, blur, watermark

Здесь мы видим настоящую историю. Есть главный герой, его трогательное действие, проработанный фон, конкретная атмосфера, отсылка к стилю известного фильма и технические параметры, включая соотношение сторон и негативный промт, который убирает лишние надписи и размытие.

Какие ошибки чаще всего допускают новички?

Одна из самых частых ошибок – излишняя абстрактность и использование оценочных суждений. Слова «красивый», «потрясающий», «эпичный» для нейросети пустой звук. Вместо «красивая женщина» стоит написать «молодая женщина с длинными светлыми волосами и голубыми глазами, с лёгкой улыбкой». Вместо «эпичный пейзаж» – «горный хребет на рассвете, вершины покрыты снегом, в долине стелется туман, лучи солнца пробиваются сквозь облака». Конкретика – ваш лучший друг.

Ещё один подводный камень – перегруженность взаимоисключающими понятиями. Не стоит в одном запросе просить «фотореалистичный мультяшный персонаж» или «минималистичный детализированный рисунок». Алгоритм просто запутается и выдаст нечто среднее и невнятное. Лучше выбрать одно главное направление и следовать ему. К тому же, не стоит перебарщивать с количеством деталей. Если вы опишете каждую мелочь вплоть до узора на обоях, нейросеть может проигнорировать львиную долю запроса, сосредоточившись на чём-то одном. Главное – найти баланс.

Кстати, о негативных промтах. Многие их просто игнорируют, и совершенно напрасно. Это мощнейший инструмент для отсечения нежелательных элементов. Если вы не хотите видеть на картинке людей, добавьте в негативный промт people. Если вам мешает какой-то цвет, смело пишите no red. Эта, казалось бы, мелочь творит настоящие чудеса и помогает добиться именно того результата, который вы грезили увидеть.

Создание промта – это не сухая наука, а скорее творческий процесс, похожий на работу скульптора, который отсекает всё лишнее. Не бойтесь экспериментировать, менять слова местами, добавлять и убирать детали. Каждая нейросеть имеет свои нюансы, и то, что идеально работает в одной, может дать сбой в другой. Практика и насмотренность – вот два кита, на которых стоит ваш будущий успех. Удачи в ваших цифровых художественных поисках.