В сети представлено множество разрозненных текстовых формул, обещающих идеальный парный портрет с первой попытки. Буквально десятилетие назад долгие недели на мучительный поиск подходящих референсов и организацию натурных съёмок мы тратили без сожаления, а сейчас генерация реалистичных изображений превратилась в обыденную рутину для креаторов. Обыватель довольно часто сталкивается с тем, что вместо живых людей на экране появляются глянцевые манекены со стеклянными глазами, а сама сцена отдаёт отвратительной пластиковой наляпистостью. С одной стороны, нейросети шагнули невероятно далеко вперёд, с другой — вытащить искреннюю эмоцию между двумя виртуальными персонажами по-прежнему довольно сложно. Плохой результат — это не всегда вина самого алгоритма, ведь проблема обычно кроется в скудном словаре автора, который забывает прописать физику света и оптические искажения. Но чтобы не ошибиться, нужно радикально пересмотреть структуру запроса, отказавшись от абстрактных пожеланий в пользу точных технических терминов.
С чего начинается выбор?
Прямо с оптики. Эстетичны ли стандартные лица по умолчанию? Само по себе сгенерированное полотно не отличается красотой, но качественная имитация конкретных объективов полностью меняет картину. Начинать нужно с фокусного расстояния, ведь именно стекло диктует настроение кадра. Выручит тридцатипятимиллиметровый дорогой фикс, усиленный открытой диафрагмой (на уровне f/1.4 или f/1.8), снабжённый лёгкой виньеткой по краям. Искусственный интеллект отлично понимает маркировки вроде «Canon EF 35mm f/1.4L II USM» или «Hasselblad medium format», поэтому не стоит гнаться за банальным определением красивого размытия. К слову, в правильном позиционировании объектов кроется львиная доля успеха. Один из самых популярных приёмов — съёмка сквозь преграду, далее следует отражение в мокром стекле, ну и, наконец, классический ракурс снизу вверх. Тем более, что добавление фразы «candid shot from a low angle, foreground blurred objects» творит чудеса, создавая иллюзию случайного подглядывания. Разумеется, такая скрупулёзная настройка требует времени, однако результат заслуживает истинного уважения.
Съёмка в Исландии: северный колорит
Чёрный влажный песок прилипает к подошвам грубых ботинок. Географическая привязка всегда работает безотказно, когда требуется воссоздать грандиозный драматический антураж. Исландия тяготеет к холодным глубоким оттенкам, поэтому базовый промт выстраивается вокруг суровых погодных условий.
Wide cinematic shot of a loving couple embracing on the black sand beach of Reynisfjara, moody overcast sky, heavy fog rolling in, wearing thick wool knitted sweaters, cinematic lighting, dramatic shadows, 8k resolution, photorealistic
Многие считают, что машина сама додумает нужную атмосферу, но на самом деле алгоритму необходимо разложить по полочкам каждую деталь. Естественно, искусственный интеллект попытается идеализировать лица, поэтому в отрицательный запрос стоит внести слова «perfect skin, airbrushed, studio lighting». Дело в том, что стерильная чистота убивает самобытный исландский дух. Кстати, знаменитый базальтовый пляж образовался после мощнейшего извержения вулкана тысячи лет назад, а сейчас его текстуры служат настоящим спасательным кругом для цифровых художников. Да и самим персонажам гораздо уютнее в плотных фактурных свитерах, нежели в лёгких летних нарядах на фоне величественных ледников.
Как выбрать свет?
Задача не из лёгких. Ведь именно свет формирует объём. Лучше отказаться от избитых формулировок, заменив их точными физическими параметрами, создавая внушительный визуальный вес. К первой группе студийных схем относится жёсткий направленный свет (hard directional light), отлично прорисовывающий скулы. Следующий важный критерий — наличие цветных фильтров на источниках, например, «neon pink rim light». Отдельно стоит упомянуть контровик, который изящно отделяет тёмные силуэты от фона. Последним в списке идёт мягкий заполняющий свет (softbox or ambient light), сглаживающий резкие тени на лицах пары.
A passionate couple illuminated by harsh cinematic rim light, dark moody background, volumetric fog, Kodak Portra 400 film stock, raw authentic photography
Это надёжно. Потому что проверено. Временем. Ну и, конечно же, не забудьте указать зернистость плёнки, она вносит свою лепту в общую картину, добавляя тот самый колоритный визуальный шум. Нельзя не упомянуть, что обилие бликов часто бьёт по бюджету вычислительных мощностей, поэтому рендер может занять чуть больше времени.
Анатомия
Слипшиеся пальцы. Зрелище поистине удручающее, способное испортить самый добротный кадр в одно мгновение, ведь такой дефект сразу бросается в глаза. Сложно ли исправить такие анатомические ошибки? Процесс не сложный, но крайне изматывающий. Вся суть в том, что генератор пока слабо понимает костную структуру человека, он лишь угадывает вероятное расположение пикселей на холсте. Все эти подводные камни всплывут незамедлительно, если герои крепко обнимаются или держатся за руки. Спасает ситуацию использование дополнительных модулей, где скелет пары задаётся заранее, но в рамках текстового промта стоит пойти на хитрость. Настоящий рай для быстрой генерации — это позы, где кисти спрятаны в карманы или заведены за спину («hands in pockets», «holding hands behind back»). К тому же, не сильно ударит по кошельку покупка бюджетного графического планшета для локальных правок через функцию Inpaint, когда нужно перерисовать всего один палец, а не запускать процесс заново. Ведь постоянная перегенерация делает кошелёк значительно легче, если вы используете платные токены коммерческих нейросетей.
Стиль гранж в интерьере
Выцветшие обои, обнажившие кирпичную кладку, и старый потёртый диван. Погружение в эстетику ушедших эпох всегда вызывает неоднозначный, но стойкий интерес у аудитории. Буквально пару лет назад цифровой бомонд требовал роскошных дворцовых интерьеров, но сейчас фокус сместился в сторону небрежного уюта. Когда вдохновение льётся рекой, хочется окунуться в атмосферу андеграунда.
Analog polaroid photo of a grunge couple sitting on a worn out leather sofa in an abandoned loft, messy hair, vintage grunge clothes, cigarette smoke, flash photography, 1990s aesthetic, raw messy environment
И всё же, не стоит перегружать сцену лишним мусором, иначе композиция превратится в неразборчивое месиво. Главное — угадать с палитрой. Выручит приглушённая жёлто-зелёная гамма, характерная для старых снимков. Безусловно, ложка дёгтя здесь заключается в лицах: ИИ норовит сделать их глянцевыми, с идеальным макияжем, что моментально рушит задуманный антураж. Поэтому в промт вписывается жёсткое уточнение: «no makeup, tired eyes, authentic imperfections».
Стоит ли экономить?
Обязательно ли выкручивать параметр стилизации на максимум? Вовсе нет. Чем выше это значение, тем дальше алгоритм уходит от вашего текстового запроса, отдавая предпочтение собственному вкусу. Степень свободы машины лучше держать под контролем, устанавливая значения в разумных пределах. Кроме того, серьёзное вложение времени потребуется для подбора правильного соотношения сторон. Квадратный формат хорош для быстрых постов, однако кинематографичный широкий угол (16:9) позволяет гармонично разместить пару в контексте пейзажа. Ну, а если говорить о весе слов в запросе, то расстановка акцентов через скобки творит настоящую магию. «(beautiful elegant couple:1.2), kissing in the rain, (cyberpunk neon city street:0.8)». А вот оригинальное название стиля всегда солирует лучше, если поставить его в самый конец строки, чтобы оно лишь деликатно полировало картинку. Само собой, эти нехитрые махинации с синтаксисом требуют привыкания, но со временем структура запроса твёрдо стоит на ногах.
Свадебное платье в динамике
Плотный белый шёлк, развевающийся на шквальном ветру. Статика безжалостно убивает эмоцию, поэтому добавление движения становится важнейшим этапом работы. Искусственный интеллект отлично справляется с заморозкой летящих объектов, если дать ему правильную команду. Механика выстраивается предельно точно: изысканный силуэт, выхваченный из темноты мощной вспышкой, окутанный густым дымом, застывший в немыслимом прыжке.
High-speed photography of a couple dancing tango, motion blur on the edges, flying red fabric, frozen droplets of water, 1/2000s shutter speed, sharp focus on faces
Нужно отметить, что именно короткая выдержка (одна двухтысячная секунды) заставляет программу прорисовывать мельчайшие капли воды с невероятной резкостью. И хотя процесс подбора идеальной фазы движения отнимает довольно много времени, обе стороны медали имеют свои бесспорные плюсы. Вы получаете абсолютно живой, не постановочный кадр, в котором каждая деталь приковывает внимание.
Детализация
Львиная доля обычных туристов оседает в популярных локациях, тогда как истинные искатели грезят о скрытых жемчужинах. Это же правило касается и нейросетей, где настоящая изюминка кроется в неочевидных деталях промта. Натыкаешься на потрясающую генерацию и понимаешь — автор явно использовал нестандартные модификаторы. Сюда стоит добавить указание конкретного типа плёнки (Fujicolor Superia 400), чтобы цвета стали более приглушёнными. Тем более, что в кадр можно вписать и любимое чадо пары, или даже собаку, хотя генерация нескольких персонажей всегда усложняет задачу. Впрочем, если пара решает облачиться в сложные национальные костюмы, исконно принадлежащие определённой культуре, готовьтесь к долгим часам правок. Вычурный орнамент часто превращается в непонятную геометрию. Однако именно такие эксперименты превращают банальный запрос в настоящий кладезь визуальных открытий. Щепетильный нюанс заключается в том, что каждое меткое слово в итоге венчает работу потрясающим портретом.
Синтетическая фотография давно перестала быть просто развлечением, превратившись в мощнейший инструмент визуализации сложных концепций. Экспериментируйте с виртуальной оптикой, не бойтесь смешивать несовместимые эпохи и всегда ищите нестандартные ракурсы, которые ломают привычные академические постулаты. Вдумчивый подход к тексту обязательно порадует домочадцев и избалованных заказчиков глубокими, эмоциональными результатами. Удачи в создании ваших цифровых миров, пусть каждая генерация запомнится надолго!