В сети представлено множество сгенерированных изображений, которые рядовой обыватель уже давно не может отличить от реальных кадров с цифровых камер. Буквально десятилетие назад создание мудборда для глянцевого журнала требовало многочасового поиска референсов на стоках, но сейчас эта львиная доля рутинной работы переложена на плечи нейросетей. Многие считают, что достаточно просто попросить алгоритм нарисовать красивую девушку в платье, но на самом деле итоговый результат часто выглядит как пластиковая кукла с неестественным, плоским освещением. Вся суть в том, что машина мыслит категориями фокусных расстояний, типов матриц и физики света, а не абстрактными человеческими эмоциями. Но чтобы не ошибиться и получить по-настоящему журнальный исходник, нужно научиться разговаривать с генератором на языке профессионального фотографа.
Оптика и свет
Бликом от софтбокса, отражённым в зрачке модели, выдаёт себя хорошая студийная постановка. И всё же добиться такого эффекта от машины бывает довольно сложно. С воздухообменом в помещении дело обстоит проще, чем с математическим просчётом лучей в популярных генераторах. Чтобы искусственный интеллект понял задачу, параметры камеры стоит прописывать скрупулёзным техническим языком. Начинается правильный запрос с указания объектива, снабжённого конкретным фокусным расстоянием, дополненного названием плёнки, подсвеченного определённой схемой. Фраза «shot on 85mm lens, f/1.8, Kodak Portra 400, Rembrandt lighting, soft shadows» творит чудеса, превращая пресную картинку в добротный современный портрет. Ведь именно качественная оптика задаёт ту самую кинематографичную глубину резкости.
Сложно ли стилизовать цифровую картинку под настоящую плёнку? Да, но результат того стоит. К слову, опытный бомонд цифровых художников активно использует негативные подсказки (negative prompts), куда обычно отправляются все артефакты генерации. Лучше отказаться от пустых описаний вроде «красиво» или «профессионально». Дело в том, что алгоритм обучался на миллионах фотографий, размеченных тегами реального студийного оборудования. Поэтому упоминание конкретной камеры — Hasselblad H6D-100c или Leica M11 — сразу подтягивает нужный колоритный визуальный стиль. Кошелёк станет легче, если покупать такую технику в реальности, но в строке ввода она доступна абсолютно бесплатно.
Fashion-съёмка в студии
А вот для коммерческой фэшн-истории потребуется совершенно иной подход. Задумка не из лёгких. Сначала мы выстраиваем базовую композицию, затем добавляем текстуры одежды, после чего закрепляем всё направленным светом. Отличный пример запроса выглядит так: «Full body shot, high fashion editorial, gorgeous female model wearing avant-garde sculptural dress made of transparent silk, dynamic pose, studio cyclorama background, dramatic three-point lighting, Profoto strobes, hyper-detailed texture, Vogue cover style, 8k resolution». Нужно отметить, что здесь солирует именно сочетание скульптурного платья и жёсткого студийного света. Вычурная наляпистость в таких кадрах будет смотреться неуместно.
Не стоит перегружать сцену лишними деталями интерьера, если главный акцент делается на одежде. Естественно, машина иногда тяготеет к излишнему драматизму, поэтому интенсивность теней лучше регулировать весами слов. В представлении многих генерация сложных тканей — процесс лёгкий. Из-за особенностей нейросетей материалы часто сливаются с кожей, если не указать фактуру предельно чётко. Выручит плотный хлопковый текстиль или глянцевый латекс, которые алгоритмы прорисовывают с пугающей, почти пугающей точностью.
Как выбрать локацию?
Съёмка на природе. Это всегда лотерея с освещением. Когда-то алгоритмы выдавали лишь мыльные пейзажи, сейчас они способны прорисовать каждую пылинку в воздухе. Особняком стоят кинематографичные сцены, вдохновлённые конкретными режиссёрами. Например, специфическая цветокоррекция в стиле Уэса Андерсона была добавлена в визуальные базы после выхода фильма «Отель «Гранд Будапешт» в две тысячи четырнадцатом году. С тех пор тег «Wes Anderson style, symmetrical composition, pastel color palette» стал настоящим спасательным кругом для любителей строгой симметрии. Это же правило касается и мрачных сцен, где референсом выступает творчество Роджера Дикинса.
«Wide angle shot, cinematic photography, a lone figure standing on an empty street at dusk, neon signs reflecting in rain puddles, anamorphic lens flare, cyberpunk aesthetic, Blade Runner 2049 vibe, muted teal and orange grading». Безусловно, этот изысканный атмосферный антураж сразу бросается в глаза. Разумеется, для такой картинки потребуется модель искусственного интеллекта с хорошим пониманием пространственной перспективы. К тому же, добавление густого тумана или проливного дождя всегда скрывает мелкие огрехи генерации на заднем плане.
Отдых в Исландии: чёрный песок
Влажным холодным ветром буквально веет от правильно сгенерированного северного пейзажа. Особый интерес вызывает контраст между тёмным фоном и яркой одеждой персонажа. Чтобы перенести героя на берег Атлантического океана, стоит использовать следующую конструкцию: «Fashion portrait, female model in a vibrant yellow waterproof raincoat, standing on Reynisfjara black sand beach in Iceland, moody overcast sky, crashing ocean waves in the background, misty atmosphere, shot on Sony A7R IV, 35mm lens, raw photo, realistic skin texture». Тем более, что именно пляж Рейнисфьяра обладает узнаваемыми базальтовыми колоннами, которые ИИ отлично воспроизводит по памяти.
Зрелище удручающее, если попытаться сгенерировать Исландию с палящим ярким солнцем. Ведь исконно эта местность ассоциируется с суровой, первозданной природой. Да и самой модели комфортнее «находиться» в естественной для локации одежде, иначе на финальном рендере всплывут логические ошибки. Многие считают, что фон не так важен, как лицо, но на самом деле окружение формирует львиную долю восприятия кадра. И всё-таки, добиваясь реализма, нет смысла тратить лимиты на описание каждого отдельного камешка под ногами.
Вредно ли перегружать запрос?
Махинации со словами. Они могут как улучшить, так и полностью разрушить кадр. С одной стороны, подробное описание даёт тотальный контроль, с другой — слишком длинные тексты размывают фокус внимания нейросети. Сначала алгоритм считывает первые двадцать слов, затем пытается вписать их в базовую композицию, после чего остатки текста применяет к мелким деталям (если на них останется «вес»). Поэтому самые важные параметры — главный объект, крупность плана, общую стилистику — стоит ставить в самое начало строки. А вот уточнения про узор на пуговицах лучше оставить на конец.
Обязательно ли прописывать каждый элемент гардероба? Вовсе нет. Не забудьте проверить, не противоречат ли ваши слова друг другу. Лучше отказаться от безумной идеи впихнуть в одну генерацию и сложную акробатическую позу, и многослойный исторический костюм, и огромную толпу на заднем плане. Не скупитесь на лаконичность там, где она действительно уместна. К слову, профессионалы давно перешли на использование референсных картинок, чтобы задать нужную позу, а текстовым запросом лишь полировать текстуры. Это надёжно. Потому что проверено. Временем.
Макро и детализация
Капли росы на лепестке алгоритмы рисуют довольно просто, а вот реалистичную текстуру человеческой кожи — с огромным трудом. Чтобы избежать эффекта идеального пластика, в ход идут весьма специфические команды. «Extreme close-up macro photography, detailed eye makeup, glossy red lips, visible skin pores, peach fuzz, studio macro ring light, captured on 100mm macro lens, highly detailed, photorealistic». Впрочем, даже с таким проработанным промтом могут возникнуть неприятные подводные камни в виде асимметрии зрачков. Неоднозначный итоговый результат часто требует локальной перерисовки (инпейтинга).
Инпейтинг — это настоящий спасательный круг для щепетильного перфекциониста. Но есть и минусы, сильно бьющие по времени работы. Тем более, что каждый новый прогон незаметно изменяет изначальный характер снимка. Ну и, конечно же, не стоит забывать про параметр хаоса, который в разных графических сетях работает по-своему. Иногда лёгкое снижение уровня соответствия тексту даёт более живой, самобытный результат, чем строгое, математически выверенное следование каждому напечатанному слову.
Оттачивать мастерство составления подобных структур придётся методом постоянных проб. Экспериментируйте с названиями старых фотоплёнок, смешивайте исторические эпохи и не бойтесь отдавать часть контроля на откуп непредсказуемому машинному зрению. Грамотно скомпилированный набор слов обязательно станет отличным решением для создания вашего идеального виртуального портфолио, которое запомнится надолго. Удачи в поисках того самого безупречного кадра!