В сети сегодня представлено невероятное множество изображений, созданных искусственным интеллектом. Пейзажи, портреты, фантастические миры — кажется, для нейросети нет ничего невозможного. Многие пользователи уже освоили генерацию одиночных персонажей, получая впечатляющие результаты буквально за пару минут. Однако стоит только попытаться «поместить в кадр» двух людей, как начинаются настоящие махинации: искажённые лица, лишние конечности и полное игнорирование контекста. Удивительно, но чтобы заставить машину понять вас правильно и создать гармоничную парную композицию, нужно освоить несколько нехитрых, но довольно важных правил составления запроса.
Как нейросеть «видит» двух человек?
Задача не из лёгких. В представлении многих обывателей, достаточно написать «влюблённая пара гуляет под дождём», и алгоритм тут же нарисует трогательную сцену. Но на деле всё обстоит сложнее. Почему так происходит? Вся суть в том, что для нейросети нет единого понятия «пара». Она видит отдельные объекты: «человек 1» и «человек 2». Когда вы смешиваете их описание в одну кучу, ИИ пытается применить всё атрибуты сразу к обоим, что и приводит к хаосу. Он может «надеть» мужскую шляпу на женщину или «отдать» женскую сумочку мужчине, а иногда и вовсе скрестить их в нечто невообразимое. Это же правило касается и внешности. Поэтому главный постулат успешной генерации парного портрета — чёткое разделение.
Нужно отметить, что современные модели (вроде Midjourney или Stable Diffusion) становятся умнее с каждым обновлением, но принцип разделения персонажей всё ещё остаётся самым надёжным спасательным кругом. Не стоит надеяться на чудо, лучше сразу разложить всё по полочкам. Ведь именно скрупулёзный подход к деталям и отличает хороший промт от набора случайных слов. Итоговый результат, созданный по такому принципу, будет выглядеть куда более целостно и правдоподобно. А потраченные на детализацию минуты с лихвой окупятся качеством изображения.
Структура промта: Разделяй и властвуй
Итак, с чего начинается правильный запрос? С определения действующих лиц и их чёткого разграничения. Забудьте про обобщения. Вместо «двое друзей» стоит писать «мужчина и женщина». Главный инструмент в этом деле — оператор AND, который позволяет создавать независимые описательные блоки для каждого персонажа. Это тот самый ключ, который открывает дверь в мир качественных парных генераций. Структура обычно тяготеет к следующей последовательности: сначала описание первого человека, затем оператор AND, а после — описание второго.
Представим это наглядно. Вместо невнятного «Мужчина и женщина в кафе» промт должен выглядеть сложнее. Например, «Высокий мужчина с тёмными волосами в сером свитере сидит за столиком AND рыжеволосая девушка в изумрудном платье сидит напротив него». Уже лучше. Теперь нейросеть понимает, что есть два разных объекта с собственными характеристиками. К этому стоит добавить описание их взаимодействия, антураж, стиль изображения и технические параметры (соотношение сторон, версия модели). Не перегружайте описание одного персонажа лишними деталями, которые могут случайно «перетечь» на второго. Главное — баланс.
Готовые промты для вдохновения
Романтика в каждом пикселе. Для создания атмосферного, эмоционального снимка стоит уделить львиную долю внимания свету и окружению. Они задают настроение. Попробуйте представить себе сцену из классического фильма, где герои не просто стоят рядом, а взаимодействуют с миром вокруг. Довольно удачный пример запроса мог бы выглядеть так:
cinematic photo of a man with short brown hair wearing a long black coat AND a woman with blonde hair in an elegant red dress, they are standing close together under one umbrella, street of a night city, rain, reflections on wet asphalt, soft romantic light from lanterns, bokeh, detailed faces, photorealistic, shot on Sony A7III
А что насчёт динамики? Статичные позы — это хорошо, но иногда хочется запечатлеть момент из жизни, какое-то действие. Здесь на первый план выходит глагол. Не просто «стоят», а «бегут», «смеются», «спорят». К слову, описание эмоций — кладезь возможностей для оживления картинки. Для создания кадра в стиле нуарного детектива подойдёт следующий промт:
A grim detective in a fedora hat and trench coat is interrogating a nervous beautiful woman in a dimly lit 1940s office, film noir style, dramatic shadows, light from a table lamp illuminates their tense faces, smoke from a cigarette curls in the air, high contrast, black and white photography, hyper-detailed
Для любителей фэнтези открываются поистине безграничные горизонты. Тут можно смело сочетать разные расы, классы и облачать героев в самые вычурные доспехи. Изюминка таких генераций — в контрасте. Например, хрупкий эльф и могучий воин. Важно не забыть описать фон, который подчеркнёт самобытный мир. Вот добротный вариант:
Epic fantasy art of a tall male knight in heavy steel plate armor with a sword on his belt AND a graceful female elf sorceress in flowing green robes with glowing magical runes, they stand on the edge of a cliff overlooking a valley with a dragon flying in the distance, majestic mountains, vibrant sunset, digital painting, style of Greg Rutkowski
Какие детали стоит уточнять?
Магия в деталях. Кроме внешности и одежды, есть ещё несколько нюансов, которые творят чудеса. Во-первых, это эмоции. Не стесняйтесь указывать, что персонажи «счастливые», «задумчивые», «удивлённые» или «смотрят друг на друга с любовью». Во-вторых, ракурс. Слова вроде «full-body shot» (в полный рост), «medium shot» (по пояс) или «close-up» (крупный план) помогут нейросети выстроить композицию. Ну и, конечно же, свет. «Мягкий утренний свет», «драматическое освещение», «неоновые огни» — всё это мощные инструменты для создания нужной атмосферы.
Однако существуют и подводные камни. Самый известный — генерация рук. Да, с этим у многих моделей до сих пор проблемы. Чтобы минимизировать риск появления шестипалых мутантов, можно использовать негативные промты (указания, чего на картинке быть не должно). Добавление в конец запроса команд вроде «–no ugly, deformed hands, extra fingers, mutated» часто улучшает результат. К тому же, не стоит запрашивать слишком сложные взаимодействия, связанные с переплетением пальцев. Иногда проще скрыть руки в карманах или за спиной, прямо указав это в промте.
Эксперименты — это ваш главный союзник. Не бойтесь менять слова местами, добавлять неожиданные детали или смешивать стили. Иногда самый безумный на первый взгляд запрос выдаёт настоящий шедевр. Попробуйте разные комбинации, меняйте ракурсы, играйте со светом и эмоциями. Каждый новый удачный промт — это не просто красивая картинка, а ещё один шаг к полному взаимопониманию с искусственным интеллектом. Удачи в ваших творческих поисках.