В сети представлено множество до боли пластиковых генераций, где влюблённые выглядят словно ожившие манекены из витрины универмага. Ни одна попытка создать романтический сюжет с наскока не обходится без комичных артефактов, когда нейросети путаются в анатомии двух близко стоящих людей, сливая воедино их руки, волосы или элементы гардероба. Многие энтузиасты грезят получить ту самую идеальную киношную картинку буквально в пару кликов, отправляя алгоритмам абстрактные пожелания о вечной любви. Но чтобы не ошибиться и не тратить долгие часы на слепой перебор сидов, нужно закладывать в запрос предельно жёсткий структурный каркас.
Базовая архитектура
Начать стоит с понимания того, как машина считывает текстовый ввод. Ведь именно порядок слов имеет решающее значение при работе с двумя объектами в одном пространстве. Сначала прописывается общий стиль кадра и тип освещения, затем детализируется первый персонаж с указанием его позиции, следом прорабатывается второй участник сцены, а в самом конце задаётся фон и технические параметры камеры. К слову, использовать лучше самые актуальные версии моделей, поскольку они гораздо точнее понимают пространственное взаимодействие сложных фигур. И всё же полностью полагаться на их самостоятельность не стоит. Настоящий кладезь удачных многофигурных композиций кроется в применении референсных изображений через параметры веса (обычно около ноль целых шести десятых).
Как удержать лица?
В фокусе внимания всегда находится портретное сходство. Сложно ли удержать два разных лица в одном кадре без их взаимного смешивания? Довольно сложно, если пустить процесс генерации на самотёк. Обычно львиная доля времени уходит на технические махинации с моделями. К первой группе спасительных решений относится тренировка отдельной полновесной модели для каждого участника съёмки. Далее следует муторный процесс их совмещения через региональные промты, когда холст буквально делится пополам строгими математическими координатами. Компактное и куда более быстрое решение кроется в использовании скриптов для замены лиц уже на этапе постобработки. Это надёжно. Потому что проверено. Временем. Впрочем, рядовой обыватель редко доходит до таких дебрей, предпочитая просто генерировать красивые, но обезличенные типажи из головы алгоритма.
Стрит-стайл и городская романтика
Капли дождя на стекле кофейни, размытые огни неоновых вывесок, густой пар от горячего эспрессо. С таких мелких, казалось бы, незначительных деталей часто начинается создание действительно колоритного атмосферного кадра. Стоит попробовать запрос, выстроенный вокруг кинематографичной уличной эстетики. Например, прописать:
medium shot of a beautiful young couple walking down a rainy tokyo street at night, neon lights reflections, cinematic lighting, 35mm lens, kodak portra 400
Зрелище получается удручающее, если забыть указать фокусное расстояние. А вот если добавить параметр сильного размытия фона, изображение моментально оживёт и приобретёт глубину. Не стоит забывать про одежду героев. Лучше отказаться от расплывчатых описаний в пользу конкретных фактур, вписанных прямо в строку: мужчина облачён в грубое шерстяное пальто, женщина укутана в объёмный кашемировый шарф. Естественно, цвета этих тканей должны контрастировать с холодным ночным окружением.
Освещение
Грамотная игра теней творит настоящие чудеса. Особенно когда речь заходит о классическом студийном портрете. Здесь безусловно солирует жёсткий направленный свет. Особый интерес вызывает запрос такого плана:
fashion editorial couple photoshoot, studio setup, dark background, dramatic rim lighting, sharp focus, high contrast, 8k resolution, photorealistic
Мужской силуэт, прорисованный контровым светом, выхваченный из темноты, подчёркнутый резкими бликами на скулах. Выглядит впечатляюще. Тем более, что цифровой мозг отлично имитирует работу реальных софтбоксов и октобоксов. Разумеется, не нужно перегружать промт десятком разных источников света. Иначе откровенная наляпистость бликов просто убьёт весь изысканный объёмный антураж.
Стоит ли добавлять эмоции?
Нужно ли прописывать конкретные улыбки, ухмылки или многозначительные взгляды? Вовсе не обязательно, но крайне желательно. Машина по умолчанию тяготеет к созданию застывших, кукольных физиономий с лёгким налётом меланхолии. Чтобы разрушить этот глянцевый панцирь, кошелёк станет легче на пару десятков лишних тестовых генераций, но итоговый результат того заслуживает. В текстовое поле стоит вплетать связки вроде «candid smile», «laughing naturally», «looking deep into each others eyes». Кстати, искренняя широкая улыбка часто провоцирует появление лишних зубов на картинке. Это связано с тем, что алгоритм пытается достроить невидимую часть челюсти на основе своей богатой, но путаной базы данных. Выручит добавление в негативный промт жёсткого запрета на деформации рта. Да и самим виртуальным людям гораздо комфортнее существовать в состоянии лёгкой, едва уловимой полуулыбки.
Свадебная фотография: Эстетика минимализма
Буквально пару лет назад качественная генерация подвенечных нарядов казалась недостижимой роскошью, но сейчас нейросети с лёгкостью выдают потрясающие глянцевые развороты. Главное — угадать с палитрой. Вычурный декор и пышные кринолины лучше сразу отбросить, они лишь запутают рендер. Запрос должен быть предельно лаконичным:
minimalist wedding photography of a happy couple, white sand beach, clear blue sky, bride in a simple silk slip dress, groom in a linen suit, natural sunlight, overexposed aesthetic, fine art photography
Внушительный массив фотографий, на которых обучались базовые модели, позволяет им идеально рендерить фактуру струящегося шёлка и мятого льна. Однако подводные камни обязательно всплывут при отрисовке рук, нежно держащих свадебный букет. Нередко вместо нормальных пяти пальцев там образуется хаотичное переплетение лишних фаланг. Не стоит тратить нервы на исправление одного испорченного кадра. Гораздо разумнее перегенерировать партию с совершенно новым сидом.
Анатомические махинации
Кисти рук и пальцы. Извечная ложка дёгтя в любой нейросетевой бочке мёда. Как избежать появления анатомических мутантов на нежном романтическом снимке? Вовсе нет нужды прописывать детальное строение каждого сустава. Довольно часто спасательный круг кроется в правильном кадрировании сцены. Если запросить «close up portrait» или классический «cowboy shot», проблемные конечности просто-напросто останутся за кадром, сэкономив вам массу времени. А если уж композиция категорически требует ростового портрета, стоит использовать негативные подсказки, насыщенные терминами вроде «bad anatomy, extra limbs, mutated hands, missing fingers». Конечно, стопроцентной гарантии защиты от брака это не даст, однако процент искажений снизит весьма ощутимо. И всё-таки, если по задумке пара крепко держится за руки, приготовьтесь к скрупулёзной ручной работе в режиме инпеинтинга.
Стилизация под плёнку
Потёртая кожа старой дальномерной камеры, громкий щелчок механического затвора, едкий запах химического проявителя в тёмной комнате. Винтажная колоритная картинка сегодня приковывает внимание куда сильнее, чем стерильный, вылизанный до пикселя цифровой рендер. Для точного воссоздания плёночного эффекта стоит использовать проверенные связки конкретных фотоаппаратов и эмульсий. Запрос:
polaroid sx-70 instant photo of an alternative couple hugging in a messy bedroom, warm vintage tones, light leaks, film grain
неизменно выдаёт самобытный, невероятно уютный результат. Нельзя не упомянуть и среднеформатную студийную классику. Фотоаппарат, оснащённый качественным японским объективом, заряженный катушкой профессиональной плёнки, прописанный как «shot on Hasselblad 500C/M, Fujifilm Pro 400H», обеспечит идеальную мягкую цветопередачу. Мягкий зеленоватый оттенок в глубоких тенях венчает эту композицию, делая её визуально неотличимой от настоящей аналоговой фотографии из прошлого века.
Повседневность в кадре: Домашний уют
С одной стороны, студийный холодный лоск привлекает внимание своей безупречностью, с другой — истинная химия между партнёрами гораздо лучше раскрывается в утренней рутине. Поэтому стоит хотя бы раз попробовать сгенерировать добротный домашний лайфстайл. Промт вроде:
cozy sunday morning couple photoshoot, sitting on a messy bed drinking coffee, golden hour sunlight coming through blinds, authentic intimacy, natural lighting, soft focus
работает практически безотказно. Здесь львиная доля успеха зависит от правильного света из окна. Именно он собирает две разобщённые фигуры в единую, цельную композицию. Тем более, утренние солнечные лучи, пробивающиеся через приоткрытые жалюзи, создают великолепный ритмичный геометрический узор на лицах и смятой ткани. Ну и, конечно же, не нужно забывать про текстуры самого постельного белья, ведь именно они добавляют плоскому кадру необходимого реалистичного объёма.
Фэнтезийные миры
В представлении многих новичков генерация влюблённых ограничивается лишь суровым реальным миром, но на самом деле умная машина способна без труда отправить героев в любую, даже самую безумную эпоху. Захотелось сказочной эльфийской эстетики? Смело вписываем в командную строку:
high fantasy cinematic shot of a royal elven couple in an ancient misty forest, wearing intricate golden armor and glowing silk robes, bioluminescent flora, ethereal atmosphere, 8k octane render
Эта грандиозная детализированная сцена потребует высоких значений параметра стилизации. Разумеется, на таких сложных, многослойных запросах искусственный интеллект часто начинает откровенно фантазировать лишнее, вплетая рога, лишние мечи или странные магические узоры туда, где им совершенно не место. Вносить свою лепту в контроль этого буйного хаоса придётся через строгий негативный промт, безжалостно отсекающий излишнюю визуальную шелуху.
Работа с динамикой
Наряд для избранных. Именно так можно охарактеризовать снимки с замершим в воздухе движением. Статичные позы довольно быстро наскучивают глазу. Внести жизнь в застывший пиксельный мир поможет описание резкого движения. Запрос:
dynamic shot of a couple dancing tango on a rainy cobblestone street, motion blur, flowing red dress, cinematic action, dramatic lighting
заставит неповоротливый алгоритм рассчитывать сложную физику летящей ткани и радиальное размытие заднего фона. Правда, с воздухообменом и развевающимися на ветру волосами дело обстоит несколько сложнее. Нейросеть частенько превращает пряди в монолитную пластиковую массу, приклеенную к черепу. Чтобы избежать подобного конфуза, стоит аккуратно уточнять характер погодных условий. Это тяжёлый, требующий терпения, но крайне эффективный способ оживить замороженную сцену. Ведь именно пойманная динамика отличает хорошую фотографию от любительской попытки просто зафиксировать момент.
Вредно ли перегружать запрос?
Имеет ли смысл писать многоэтажные поэмы на пять абзацев, описывая каждую пуговицу на рубашке партнёра? Суровая практика показывает, что нет. Современные текстовые кодировщики страдают своеобразным дефицитом внимания. Они отлично, с высокой точностью считывают первые пятнадцать-двадцать слов, а всё остальное нещадно превращают в серый информационный шум. Поэтому не стоит гнаться за бесконечным количеством красивых эпитетов. Лучше сосредоточить усилия на подборе точных существительных и сильных глаголов. Вместо пространного рассуждения о том, как красиво падает вечерний свет на левую щёку задумчивого мужчины, достаточно сухо указать «rembrandt lighting». Ну, а если композиция критически требует выделить конкретную деталь, её следует поместить в самое начало промта, обособив скобками с указанием приоритетного веса.
Искусство составления правильных инструкций для нейросетей требует не только насмотренности, но и изрядной доли упрямства. Обе стороны медали здесь предельно ясны: либо вы берёте управление электронным мозгом в свои руки, выстраивая чёткую логику слов, либо машина выдаёт вам совершенно случайный набор отполированных пикселей. Смело экспериментируйте с контрастным освещением, не бойтесь сталкивать лбами несочетаемые на первый взгляд стили и всегда держите под рукой заранее подготовленный негативный блок слов. Пусть каждый сгенерированный кадр бьёт точно в цель и передаёт ту самую неуловимую искру, ради которой весь этот цифровой процесс и затевался!