В сети представлено множество сгенерированных портретов, где идеальные лица с безупречной кожей смотрят в объектив стеклянным взглядом. Обыватель, возможно, и восхитится подобной наляпистостью, но настоящий профи сразу заметит фальшь. Буквально пару лет назад получить фотореалистичный результат казалось грандиозным прорывом, однако сейчас планка качества взлетела до небес. Ведь заказчики грезят о кадрах, которые невозможно отличить от работы маститого мастера с дорогой оптикой. А чтобы не ошибиться и не потратить часы на генерацию очередного бездушного манекена, нужно скрупулёзно собирать текстовый запрос, учитывая мельчайшие нюансы света, композиции и даже дефектов плёнки.
Стоит ли экономить слова?
Вводную фразу «raw photo» многие добавляют по инерции. Это же классика, которая тяготеет к реализму и отсекает лишнюю стилизацию. С одной стороны, нейросеть отлично понимает короткие ёмкие команды, с другой — дьявол всегда кроется в деталях. Тем более, что слишком длинные описательные конструкции часто запутывают алгоритм, заставляя его игнорировать важные аспекты. Выручит точный лаконичный синтаксис. Запрос, начинающийся с описания главного объекта, дополненный параметрами освещения, отшлифованный указанием конкретного объектива, сработает безотказно. Далее следует блок с атмосферой и цветокоррекцией. Отдельно стоит упомянуть оптику, прописывая фокусное расстояние вплоть до миллиметров. Ну и, наконец, венчают этот спасательный круг негативные подсказки, без которых индустрия просто не стоит на ногах.
Студийный портрет в высоком ключе
Блики на радужке глаза. Именно с этой мелкой, казалось бы, детали начинается глубокий реализм в портретной генерации. Естественно, добиться такого эффекта довольно сложно, если просто написать «красивая девушка в студии». Настоящий кладезь для специалиста — применение конкретных схем постановки света. К первой группе относится классический рембрандтовский свет с мягким треугольником на щеке. Следующий важный критерий — текстура кожи. Не стоит забывать про поры, лёгкий пушок и микроскопические несовершенства. Ведь именно эти постулаты творят чудеса, делая снимок живым. Для получения добротного студийного кадра отлично работает связка:
award-winning portrait photography, 35-year-old Scandinavian woman, subtle freckles, cinematic rim lighting, neutral grey background, shot on Hasselblad H6D-100c, 85mm lens, f/1.8, extremely detailed, 8k resolution
И всё же, даже при скрупулёзном подходе, иногда всплывут артефакты в виде лишних теней.
Локация
Выбор фона имеет огромное значение. Это основа. Ведь именно антураж задаёт настроение всему сету. К слову, генераторы часто грешат размытием заднего плана до состояния невнятного пятна, если им не дать чётких инструкций. В представлении многих достаточно указать город, но на самом деле лучше привязывать сцену к конкретному времени суток и погодным условиям. Компактное решение — использовать комбинацию из состояния атмосферы и архитектурных элементов. Например, мокрой от дождя брусчатке можно позволить отражать неоновый свет, если добавить в промт:
neon reflections on wet asphalt, moody atmosphere, Tokyo street at midnight, anamorphic lens flare
В памяти зрителя оседает именно объёмный фон. Впрочем, отлично солирует в кадре и чистая природа, когда температура поднимается до плюс тридцати градусов, а жёсткое солнце создаёт резкие тени на песке.
Как имитировать плёнку?
Зрелище удручающее, когда идеально выстроенная композиция отдаёт цифровым пластиком. Нужно ли мириться с этой неестественной гладкостью? Вовсе нет. Довольно просто внести свою лепту в создание аутентичного винтажного вида, добавив правильные маркеры аналоговой фотографии. Дело в том, что шум и зерно ломают стерильность картинки, обманывая глаз критика. Исконно плёночные артефакты вроде лёгкой хроматической аберрации или виньетирования приковывают внимание к центру экспозиции. Специфический подход требует указания конкретного типа эмульсии (плёнки). Замечательно работает «Fujifilm Superia X-TRA 400» для зеленоватых теней или «Ilford HP5 Plus 400» для контрастного монохрома. К тому же, не лишним будет упомянуть «light leaks» и «heavy film grain», чтобы кошелёк стал легче только у виртуального заказчика, а результат выглядел на миллион долларов.
Оптика
С фокусным расстоянием дело обстоит сложнее. Законы физики алгоритмы часто игнорируют, пытаясь впихнуть невпихуемое в один кадр. Безусловно, правильный выбор объектива меняет геометрию лица и перспективу. Широкоугольный дорогой объектив визуально вытянет передний план, что отлично подойдёт для фэшн-съёмки в тесных интерьерах. А вот для бьюти-портретов лучше отказаться от экспериментов и использовать проверенные восемьдесят пять или сто тридцать пять миллиметров. Разложить по полочкам параметры диафрагмы тоже имеет смысл. Ведь глубина резкости напрямую зависит от значения f-stop. Указав диафрагму f/1.2, вы гарантированно получите кремовое боке, тогда как f/8 даст резкость по всему полю кадра, что критически важно для коммерческих лукбуков.
Репортажный стиль
Внезапный порыв ветра растрепал волосы. Именно такие случайности делают репортажную фотографию по-настоящему самобытной. Задать этот колоритный хаос искусственному интеллекту — задача не из лёгких. Разумеется, статические позы здесь не сработают, поэтому стоит использовать глаголы непрерывного действия. В кадре модель должна идти, смеяться, поправлять одежду или смотреть за пределы объектива. Специфический лексикон стрит-фотографов здесь льётся рекой:
candid street photography, motion blur, caught off guard, walking through crowded market, paparazzi style, authentic emotion
Конечно, контроль над композицией в таком случае немного теряется, однако результат того стоит. Бросается в глаза то, как создаётся иллюзия реального момента, вырванного из временного потока.
Вредно ли перегружать запрос?
Многие считают, что огромным текстом можно точнее донести идею, но на самом деле львиная доля слов-описаний просто стирается алгоритмом. Махинации с добавлением десятков художников и сотен эпитетов вроде «beautiful, gorgeous, stunning» лишь размывают фокус. Не стоит гнаться за длиной предложения. Лучше оставить только мощные смысловые якоря. Подводные камни длинных промтов заключаются в том, что вес каждого последующего слова снижается экспоненциально. Поэтому самое важное всегда нужно выносить в начало. Если главное — фактура ткани, то текст должен начинаться с неё. Например:
macro shot of intricate lace dress, morning sunlight filtering through fabric, soft focus background
Такой точечный метод не сильно ударит по времени генерации, зато выдаст предсказуемую и точную картинку.
Работа с освещением
Свет лепит форму. Это непреложная аксиома. Буквально десятилетие назад на выставление приборов часы тратили фотографы, а сейчас мы делаем это текстовыми командами. Само собой, ограничиваться банальным «natural light» — удел абсолютных новичков. Эксперты используют сложные световые схемы. Во-первых, отлично работает «Rembrandt lighting» для драматичных глубоких портретов. Во-вторых, «butterfly lighting» спасёт бьюти-съёмку, подчеркнув скулы. Ну и, наконец, «split lighting» создаст колоритный образ с сильным контрастом, показывая обе стороны медали. Нельзя не упомянуть и цветные фильтры. Добавив «cinematic teal and orange lighting» или «neon pink backlight», атмосферу кадра можно кардинально изменить без замены локации или одежды.
Ракурс и композиция
Острый угол снизу. Подобный взгляд на объект моментально придаёт ему внушительности. Вся суть в том, что позиция камеры диктует восприятие зрителя. Довольно часто авторы забывают управлять этой настройкой, отдавая её на откуп машине. А ведь правильный ракурс способен полностью перекроить геометрию сцены. Изысканный кинематографический эффект даёт «low angle shot» или «Dutch angle», где горизонт намеренно завален на пятнадцать градусов. Ложкой дёгтя в этом процессе выступает нежелание нейросети делать вид сверху, но команда «bird’s-eye view» обычно решает проблему. Если написать «looking away» или «looking into the distance», снимок сразу приобретёт задумчивый характер. Часто натыкаешься на откровенный брак, если камера установлена слишком близко, поэтому бюджетный вариант оптики здесь не подойдёт, нужно чётко задавать дистанцию фокуса.
Негативные подсказки
Всегда ли нужно прописывать то, чего мы не хотим видеть? Безусловно. Отрицательный запрос выступает в роли своеобразного сита, которое отсекает визуальный мусор и анатомические аномалии. В представлении обывателей достаточно написать «bad anatomy», но на деле этот процесс требует более щепетильного подхода. Стоит задуматься о блокировке стилизаций. Если нужен фотореализм, в негативный блок сразу же отправляются слова:
illustration, 3d render, painting, cartoon, anime
К тому же, обязательно стоит указать «overexposed, underexposed, blurry, plastic skin, mutation, extra fingers, poorly drawn hands». Да и самим алгоритмам комфортнее работать в жёстких рамках ограничений, чтобы ваше цифровое чадо не превратилось в монстра. Такой серьёзный список запретов не перегружает основную идею. Он лишь направляет пиксели в нужное русло.
Фэшн-съёмка и стайлинг
Ткань, спадающая тяжёлыми складками. Фактура материалов в модной фотографии занимает центральное место. Прохожий не обратит внимания на плетение нитей, но для бомонда это маркер истинного качества. Выбор гардероба должен быть максимально конкретным, иначе система наденет на модель усреднённый серый свитер. Описание наряда стоит начинать с материала и кроя. Например, «oversized silk blouse» или «tailored tweed jacket». Отдельно стоит упомянуть аксессуары, которые завершают образ. Массивные золотые серьги или винтажные очки станут той самой недостающей изюминкой. Сложно ли стилизовать вычурный наряд высокой моды? Да, но результат определённо окупает усилия. Отлично показывает себя промт:
vogue editorial photography, high fashion, avant-garde outfit made of translucent latex, dramatic studio lighting, sharp focus, 8k
Серьёзное вложение времени в подбор текстур окупается мгновенно. Впрочем, не стоит перебарщивать с деталями, чтобы роскошный наряд не превратился в невнятную кашу.
Что насчёт нейросетевых движков?
Каждый генератор обладает своим специфическим характером. То, что идеально работает в одной среде, может выдать совершенно неоднозначный результат в другой. Если интерфейсы на базе Stable Diffusion требуют почти программистского подхода со скобками и весами, то популярный Midjourney лучше воспринимает художественный, живой текст. Тем более, что в последнем случае можно смело использовать имена мировых легенд. Запрос в духе «shot by Annie Leibovitz» автоматически подтягивает определённые цветовые палитры. Однако спектр задач не ограничивается только людьми. При генерации предметной базы для каталога лучше отказаться от художественности и использовать строгие сухие команды вроде:
commercial product photography, clean white background, studio softbox
Точный текстовый запрос — это лишь половина пройденного пути. Настоящее волшебство рождается в бесконечных экспериментах с весами слов, сменой соотношения сторон и тонкими настройками негативного промта. Не стоит бояться ломать устоявшиеся шаблоны и комбинировать несочетаемые стили, добиваясь идеальной картинки. Удачи в создании поистине живых генераций, которые поразят воображение зрителей!