Промты для двух девушек (с примерами готовых промтов)

В сети можно найти тысячи потрясающих изображений, сгенерированных искусственным интеллектом, и львиная доля из них – это портреты людей. Кажется, что может быть проще: ввёл описание и получил идеальный результат. Однако, как только задача усложняется и в кадре появляется не один, а два или более персонажей, многие новички натыкаются на стену непонимания. Нейросеть начинает путать детали, смешивать цвета волос, «переодевать» героинь или, что ещё хуже, создавать пугающих гибридов. Но чтобы не наткнуться на разочарование и не потратить часы на бесполезные попытки, стоит сперва разобраться в логике машины и освоить несколько простых, но действенных приёмов.

Как нейросеть «видит» двух персонажей?

Почему же так сложно? Всё дело в том, что для нейросети промт – это не чёткая инструкция, а скорее облако тегов, суп из ингредиентов. Запрос «две девушки, одна в красном платье и блондинка, другая в синем и брюнетка» нейросеть может воспринять как общий набор характеристик: «девушка», «девушка», «красное платье», «синее платье», «блондинка», «брюнетка». А затем она попытается случайным образом распределить эти атрибуты между двумя объектами в кадре. Именно из-за этого подхода и рождаются блондинки в синих платьях или, что довольно часто случается, две девушки с рыжеватыми волосами в фиолетовых нарядах – эдакий усреднённый результат. Задача пользователя – помочь машине провести чёткую границу между персонажами. Нужно буквально «привязать» каждое описание к конкретной фигуре, не давая алгоритму свободы для импровизации.

Задача не из лёгких. Но решаемая. Главный инструмент здесь – детализация и структурирование запроса. Вместо того чтобы сваливать все эпитеты в одну кучу, стоит разложить их по полочкам, создавая для нейросети два отдельных, независимых «файла» с описаниями. Нужно отметить, что современные модели ИИ (вроде Midjourney v6 или DALL-E 3) справляются с этой задачей значительно лучше своих предшественников, но даже им требуется помощь. Скрупулёзный подход к составлению промта творит настоящие чудеса, превращая хаотичный набор образов во вполне осмысленную и гармоничную композицию. А начать нужно с базовых постулатов построения запроса.

Базовая структура промта: Уточнение деталей

Чтобы получить предсказуемый результат, стоит придерживаться определённой последовательности в описании. Начать нужно с главного – с указания количества и общего описания персонажей. Например, «две молодые девушки, лучшие подруги». Это задаёт тон всей сцене. Далее следует самый важный блок – детальное и раздельное описание каждой из них. Здесь-то и кроется изюминка. Вместо перечисления через запятую, стоит использовать специальные маркеры или скобки, чтобы разграничить героинь. К слову, некоторые нейросети хорошо понимают прямые указания вроде «девушка слева» и «девушка справа», но это не всегда работает.

После того как внешность и одежда каждой девушки подробно описаны, наступает черёд описания их взаимодействия и позы. Что они делают? Смеются, обнимаются, смотрят друг на друга, бегут по пляжу, сидят в кафе. Этот динамический элемент оживляет картинку. Ну и, конечно же, не стоит забывать про антураж. Описание фона, окружения и общего настроения сцены – это третий кит, на котором держится хороший промт. Одно дело – «на белом фоне», и совсем другое – «сидят на подоконнике в уютной парижской квартире во время дождя, за окном видны крыши Монмартра». Последний штрих – это технические параметры: стиль, освещение, цветовая палитра, соотношение сторон и используемая камера.

Стоит ли использовать имена?

Маленькая хитрость. Один из довольно эффективных способов разделить персонажей – дать им условные имена. Поможет ли это? Безусловно. Когда вы пишете «Анна в красном платье, а Мария в синем», вы создаёте для нейросети мощный якорь. Имя становится уникальным идентификатором, к которому привязываются все последующие характеристики. Это работает гораздо надёжнее, чем простое перечисление. Разумеется, нейросеть не знает, как выглядит некая Анна, но она понимает, что все атрибуты, идущие после этого имени, относятся к одному конкретному объекту, а не ко всей сцене целиком.

Такой подход особенно выручает в сложных композициях, где у каждой девушки множество уникальных деталей – причёска, макияж, аксессуары, эмоции. Промт может выглядеть примерно так: «Две девушки, (Анна: длинные светлые волосы, зелёные глаза, смеётся, одета в белую летнюю блузку), и (Ольга: тёмные вьющиеся волосы, карие глаза, улыбается, на ней джинсовая куртка)». Скобки и имена в этом случае работают как контейнеры, не позволяя описаниям перемешаться. Это же правило касается и любых других объектов на сцене, если их нужно наделить специфическими чертами.

Готовые промты: От простого к сложному

Теория – это хорошо, но без практики она мертва. Давайте разложим по полочкам несколько конкретных примеров, которые можно взять за основу для собственных экспериментов.

Начнём с классического портрета. Задача: две подруги, одна блондинка, другая рыжая, в осеннем парке. Простой, казалось бы, запрос, но и в нём есть нюансы.

Пример промта: «photo of two best friends in their early 20s, girl 1 has long blonde hair and is wearing a beige trench coat, girl 2 has curly red hair and is wearing a green knitted sweater, they are smiling and looking at the camera, sitting on a park bench, autumn scenery with yellow leaves, soft sunlight, cinematic shot, high detail, Canon EOS 5D Mark IV photo»

В этом промте мы использовали нумерацию («girl 1», «girl 2») для разделения. Чётко прописана одежда, причёска, эмоция и фон. Добавлены технические детали (cinematic shot, Canon EOS 5D Mark IV), которые помогают добиться фотореализма.

А теперь усложним задачу и добавим динамики. Пусть наши героини будут в фэнтезийном образе, в движении.

Пример промта: «epic fantasy art, two elf girls running through an enchanted forest at night, (first elf: silver hair in a braid, wearing light blue flowing dress, holding a glowing staff), (second elf: dark brown hair, wearing leather armor with green accents, holding a bow), moonbeams filtering through the trees, magical atmosphere, glowing particles in the air, detailed faces, dynamic poses, art by Greg Rutkowski»

Здесь для разделения используется уточнение в скобках. Вся суть в том, что мы создаём два мини-описания внутри одного большого. Кроме того, указан конкретный стиль («art by Greg Rutkowski»), который задаёт определённую эстетику всему изображению, делая его колоритным и атмосферным.

Ну и, наконец, пример для любителей киберпанка. Здесь важна не столько внешность, сколько детализация окружения и аксессуаров.

Пример промта: «cyberpunk scene, two female hackers in a neon-lit server room, (Hacker A: short pink hair with an undercut, wearing a black jacket with glowing patterns, augmented reality glasses), (Hacker B: long black dreadlocks, wearing a holographic hoodie, intricate tattoos on her arms), they are typing on futuristic interfaces, cables and wires everywhere, reflections on the wet floor, Blade Runner aesthetic, hyperrealistic, octane render»

В этом запросе мы снова видим разделение с помощью имён-маркеров («Hacker A», «Hacker B»). Львиная доля внимания уделена антуражу: неоновое освещение, серверная комната, голографические интерфейсы. Упоминание «Blade Runner aesthetic» и «octane render» мгновенно настраивает нейросеть на нужный визуальный лад.

Какие есть подводные камни?

Процесс не всегда идёт гладко, даже с идеально составленным промтом. Одна из самых частых бед – это артефакты генерации, особенно с конечностями. Лишние пальцы, странно изогнутые руки или ноги – к этому стоит быть готовым. Впрочем, с каждой новой версией нейросетей эта проблема становится менее острой. Кроме того, не стоит удивляться, если ИИ всё-таки «перепутает» детали. Иногда он может взять цвет глаз от одной девушки и отдать другой, или смешать стили одежды. Это не ошибка, а скорее творческая интерпретация.

Ещё один нюанс – это борьба с «сиамскими близнецами». Иногда, при очень близком расположении, нейросеть может попытаться буквально срастить персонажей, особенно если в промте есть слова вроде «обнимаются» или «держатся за руки». Чтобы этого избежать, можно добавить в негативный промт (если такая функция есть) слова вроде `fused, conjoined, extra limbs`. А если такой функции нет, стоит попробовать переформулировать запрос, сделав позу менее контактной. Тем более что результат часто превосходит все ожидания.

Главное – не бояться экспериментов и пробовать снова, ведь каждый новый запрос творит маленькое цифровое чудо. Удачи в ваших творческих поисках.