В сети выставлены напоказ миллионы сгенерированных изображений влюблённых, чьи пластиковые лица и сплетённые в жуткие узлы пальцы способны вызвать скорее оторопь, нежели умиление. Многие до сих пор полагают, будто машине достаточно скормить пару ласковых слов, чтобы на выходе получился шедевр журнального уровня. Обыватель часто забывает, что за каждым реалистичным кадром скрывается скрупулёзный текстовый инжиниринг. И всё же создать добротный парный портрет вполне по силам каждому. Но чтобы не ошибиться, нужно грамотно расставить акценты в самом запросе.
С чего начинается композиция?
Задача не из лёгких. Ведь алгоритмы шестой версии Midjourney или последних моделей Stable Diffusion невероятно чувствительны к порядку слов. Сначала формируется ядро запроса, усиленное глаголами действия, отлитое в конкретную атмосферу, снабжённое параметрами виртуальной оптики. Буквально десятилетие назад подобный контроль над пикселями казался фантастикой, но сейчас мы можем управлять виртуальным светом с точностью до миллиметра. К первой группе обязательных тегов относится описание самих героев и их взаимодействия. Далее следует локация. Ну и, наконец, технические маркеры.
Обязательно ли прописывать технику? Вовсе нет. Однако именно спецификация оптики творит чудеса. Например, базовый промт для повседневной романтики можно сформулировать так:
«A candid photograph of a happy young couple laughing while running under the rain in neon lit Tokyo street, shot on 35mm lens, f/1.8, cinematic lighting, motion blur, photorealistic, 8k»
Здесь в кадре солирует динамика. Размытый фон, возникший из-за открытой диафрагмы, автомат отсекает, фокусируя внимание зрителя исключительно на неподдельных эмоциях. К слову, не стоит гнаться за перечислением десятков художников или стилей, как это было принято в ранних версиях нейросетей.
Романтический реализм
Капли дождя медленно стекают по стеклу старой телефонной будки, пока двое пытаются укрыться от лондонского ливня под одним потёртым плащом. Именно такие живые сцены сегодня выдают лучшие алгоритмы. Настоящий рай для тех, кто ищет вдохновение для реальных фотосессий. Чтобы получить подобный результат, в промте стоит использовать слова «documentary photography» или «candid shot». Они убивают искусственную студийную вычурность. В представлении многих идеальная пара должна застыть в неестественной позе, глядя прямо в объектив. На самом деле самые колоритные кадры получаются, когда модели заняты делом.
Отличной иллюстрацией послужит следующий запрос:
«A documentary photo of an authentic couple cooking dinner together in a messy cozy kitchen, flour on their faces, warm yellow overhead lighting, highly detailed skin texture, shot on Fujifilm XT4, kodak portra 400 film simulation»
Этот промт — настоящий кладезь для любителей уютного антуража. Дело в том, что плёночные симуляции добавляют изображению характерный шум и лёгкую несовершенность. Да и самим виртуальным героям куда комфортнее существовать в слегка неряшливой среде, где нет места глянцевой пустоте.
Тяготеет ли ИИ к анатомическим ошибкам?
Справляются ли современные генераторы с человеческими руками? Само по себе слияние конечностей случается уже реже, но расслабляться явно рано. Когда пара на фото обнимается, алгоритм часто путается в количестве переплетённых пальцев. Чтобы подводные камни генерации не испортили итоговый результат, лучше отказаться от полных ростовых портретов в пользу поясных планов. К тому же выручит грамотный негативный промт (если платформа его поддерживает), куда обязательно вписываются теги «mutated hands, extra fingers, deformed limbs, merged bodies».
Для безопасного, но впечатляющего студийного кадра стоит протестировать такую связку:
«High fashion editorial portrait of an elegant couple standing close to each other, waist up shot, man in a tailored dark suit, woman in a minimalist silk slip dress, dramatic chiaroscuro lighting, dark grey studio background, Phase One XF IQ4 camera, ultra-detailed eyes»
Выглядит впечатляюще. Резкие тени скрадывают сложные участки анатомии, а львиная доля внимания достаётся текстуре ткани и чертам лица. Разумеется, здесь нет места наляпистости. Строгий современный стиль требует лаконичных формулировок.
Свадебное фото в ретро-стиле
Назад в прошлое. Винтажная эстетика всегда пользовалась огромным спросом среди тех, кто устал от идеальных цифровых пикселей. Египетская цивилизация всегда вызывала трепет археологов, а нас сегодня не меньше интригует фактура старых фотографий. Имитировать плёнку довольно просто. Главное — угадать с палитрой и указать тип камеры. Нельзя не упомянуть, что для достижения максимального сходства с эпохой семидесятых или восьмидесятых годов нужно добавлять артефакты: засветки, царапины, выцветшие края.
Вот конкретный пример изящной стилизации:
«A vintage 1970s polaroid photo of a newlywed couple at a backyard wedding, faded colors, light leaks, natural afternoon sunlight, bride wearing a simple lace dress with messy hair, groom in a beige linen suit, authentic genuine smiles, nostalgic atmosphere»
Дополняет образ лёгкая расфокусировка по краям кадра. Впрочем, иногда нейросеть слишком увлекается размытием, поэтому не забывайте добавлять параметр «sharp focus on faces». Тем более, что именно лица передают ту самую изюминку, ради которой создаётся портрет.
Динамика в кадре
Статика скучна. Чтобы заставить картинку дышать, нам потребуются сильные глаголы. Бег, танец, прыжок, случайный поворот головы — всё это вносит лепту в общую реалистичность. Серьёзное вложение в аренду ветродуев и сложных подвесов сильно бьёт по бюджету реального фотографа, а вот кошелёк генеративного художника от добавления слов «wind in hair» или «flying fabric» станет легче разве что на несколько токенов. С воздухообменом дело обстоит сложнее только на этапе рендера видео, а для статики это идеальный приём.
Попробуйте использовать такую конструкцию:
«An action shot of a passionate couple dancing tango on a dimly lit street in Buenos Aires, motion blur on the woman’s red dress, sharp focus on their intense eye contact, cinematic street lighting, foggy background, 50mm f/1.2, masterpiece»
Зрелище получается поистине грандиозное. Обе стороны медали здесь уравновешены: мы видим и смазанное движение, и чёткие лица. Ведь именно контраст между статикой и динамикой удерживает взгляд зрителя на изображении.
Освещение
Без света нет фотографии. Это же правило касается и нейросетей. Если пустить освещение на самотёк, ИИ зальёт сцену плоским белым светом, который моментально выдаст искусственное происхождение картинки. Начинать эксперименты стоит с «golden hour» (золотого часа перед закатом) или «blue hour» (сумерек). Отдельно стоит упомянуть контровой свет («backlighting»), который создаёт красивый ореол вокруг волос моделей и визуально отрывает их от заднего фона.
Свежий взгляд на вечернюю съёмку подарит этот промт:
«A cinematic wide shot of a couple sitting on the hood of a classic car looking at the starry night sky, illuminated by warm headlights and soft moonlight, milky way visible in the sky, long exposure photography style, majestic landscape, Sony A7R IV»
Здесь природа и техника работают в единой связке. Свет фар, прорезающий темноту, выстраивает алгоритм так, чтобы лица героев оставались в лёгкой полутени, сохраняя атмосферу таинственности. Да и сам масштаб сцены заслуживает истинного уважения.
Не бойтесь экспериментировать с дистанцией и ракурсами. Смешивайте разные стили, чередуйте крупные планы с широкими кинематографичными панорамами, убирайте лишние эпитеты и оставляйте только суть. Практика показывает, что самые выразительные портреты рождаются там, где автор оставляет алгоритму немного воздуха для интерпретации, но жёстко контролирует техническую базу. Удачи в создании ваших идеальных генеративных шедевров, пусть каждая новая попытка приносит всё более впечатляющий результат.