В сети представлены огромные массивы сгенерированных изображений, однако львиная доля этих картинок страдает от откровенной пластиковой вылизанности. Устав от суеты и бесконечных попыток получить реалистичный кадр, опытные креаторы начинают копать в сторону профессиональной фотографической терминологии. Плохой сон – это не всегда следствие сильного стресса, иногда это результат многочасовой битвы с непослушной нейросетью за правильные тени. В представлении многих достаточно просто попросить систему сделать «красиво», чтобы получить на выходе настоящий шедевр. Но чтобы не ошибиться, нужно полностью перестроить привычное мышление и заговорить с машиной на языке диафрагм.
С чего начинается выбор?
Задача не из лёгких. Обязательно ли прописывать каждую мелочь в текстовом поле? Вовсе нет. Разумеется, нейросеть способна додумать образовавшиеся пустоты, однако результат вас вряд ли обрадует. Ведь именно свет творит чудеса, задавая общее настроение композиции. Сначала мы набрасываем грубый контур сюжета, затем аккуратно вплетаем параметры окружающей среды, ну и, наконец, шлифуем всё это оптическими характеристиками виртуального объектива. Это логично. Потому что проверено. Временем. И всё же обыватель упорно игнорирует техническую базу, надеясь исключительно на магию программного кода. А вот грамотный специалист понимает, что каждое добавленное слово имеет огромный вес. Дело в том, что текстовый движок обучался на тегах, которыми размечали оригинальные снимки на стоках. Поэтому перед генерацией стоит разложить по полочкам всю структуру запроса.
Фокусное расстояние и оптика
Блики от мощного студийного источника мягко ложатся на стеклянную линзу. К слову, правильный подбор виртуальной оптики решает ровно половину проблем с неестественностью пропорций. Размывает задний фон тяжёлый портретный объектив, конкретные параметры которого мы просто обязаны скормить нейросети. Например, добротный классический полтинник со значением диафрагмы f/1.2 даёт ту самую кинематографичную глубину резкости. А вот для бескрайних природных пейзажей лучше использовать сверхширокие углы обзора. Не стоит перебарщивать с экстремальным макро, если вы не планируете в мельчайших деталях рассматривать текстуру кожи. Алгоритмы довольно часто ломаются на микроскопических дистанциях, выдавая в итоге невнятную кашу. Тем более, что фокусное расстояние в 85mm считается исконно портретным стандартом для передачи правильной геометрии лица. Выручит указание брендов. Оседает в памяти картинка, сгенерированная с припиской «Carl Zeiss lens». Этот изысканный нюанс приковывает внимание, добавляя характерный микроконтраст. Кроме того, покупка реальной оптики такого уровня сильно бьёт по бюджету, а в виртуальном пространстве она доступна совершенно бесплатно.
Плёночная эстетика
Буквально десятилетие назад абсолютная цифровая резкость была пределом мечтаний, но сейчас творческий бомонд снова тяготеет к ламповой теплоте аналога. Наляпистость чрезмерно детализированных краёв, присущая ранним генерациям, серьёзно бросается в глаза. Заслуживает истинного уважения скрупулёзный подход к имитации конкретных фотоматериалов. К первой группе относится самобытный профиль эмульсии Kodak Portra 400, давно воспетой свадебными фотографами за безупречный скинтон. Далее следует колоритный контраст плёнки Ilford HP5, применяемой для создания глубоких монохромных шедевров. Последним в списке идёт нестандартная киноплёнка Cinestill 800T, создающая узнаваемые красные неоновые ореолы вокруг фонарей. Историческая справка здесь будет весьма уместна. Массовая цветная фотография появилась в 1935 году, однако настоящую свободу уличные репортёры обрели лишь с выходом высокочувствительных плёнок в бурных семидесятых. Нужно отметить, что нейросети великолепно знают эти исторические маркировки. Нельзя не упомянуть о том, что в их базах лежат миллионы подписанных сканов. Не нужно изобретать ничего нового.
Освещение сцены
Настоящий рай для виртуального фотографа наступает в момент кропотливой работы со светом. Сложно ли имитировать вычурный студийный сетап? Да, но результат того определённо стоит. С одной стороны, всегда можно обойтись банальным золотым часом, с другой — куда интереснее выстроить грандиозный драматичный сюжет. Рембрандтовский свет, например, добавляет портретам нужной глубины. Впрочем, не стоит забывать про отражатели. Когда мягкий свет льётся рекой на лица моделей, это происходит именно благодаря промптам вроде «diffused softbox lighting». Кстати, резкие контрастные тени от жёсткого солнца в зените тоже отлично работают для уличных съёмок. Эта визуальная изюминка делает кадр живым. Естественно, нужно учитывать и цветовую температуру. Солирует в ночных сценах холодный лунный свет, перемешанный с тёплыми отблесками витрин. Ну, а если вы хотите создать атмосферу таинственности, смело прописывайте «cinematic rim lighting», чтобы отделить объект от фона.
Архитектура запроса
Компактное решение всегда выигрывает у пространных текстов. Безусловно, иногда хочется расписать каждый волосок на голове главного персонажа. Однако громоздкие абзацы алгоритм просто не дочитывает, теряя суть. Выручит строгая, железобетонная последовательность текстовых блоков. Сначала идёт крупность плана, следом прописывается сам объект, после чего мы аккуратно добавляем окружение, снабжённое конкретными погодными условиями. Львиная доля успеха кроется в правильной расстановке весовых коэффициентов. Естественно, для разных архитектур нейросетей синтаксис будет немного отличаться, но базовые постулаты остаются неизменными во все времена. Это же правило касается и негативных промптов, которые работают как настоящий спасательный круг. Откажитесь от пустых слов вроде «потрясающий» или «высокое качество». Махинации с абстрактными понятиями совершенно не работают. Натыкаешься на такие запросы постоянно, хотя они лишь создают визуальный шум.
Рабочие формулы
Перейдём к примерам. Один из самых востребованных видов запроса строится на уличной эстетике. Для начала мы пишем:
Candid street photography of an elderly man in a tweed coat reading a newspaper in a rainy Tokyo cafe
Далее обязательно добавляем мощную техническую базу:
shot on Leica M10, 35mm f/2.0 lens, moody cinematic lighting, cinematic color grading, 8k resolution, film grain
Следующий интересный вариант поможет облачиться в классический студийный глянец. В строку уверенно вписывается:
Fashion editorial portrait of a young woman with natural freckles, wearing an oversized beige trench coat, solid dark grey background
Затем вносится лепта освещения:
Profoto studio strobes, Rembrandt lighting, shot on Hasselblad medium format, Kodak Portra 160, highly detailed
Ну и, конечно же, нельзя обойти стороной сложный интерьерный кадр. Здесь венчает композицию строгая геометрия:
Architectural photography of a brutalist raw concrete house in a dense pine forest at dawn, heavy morning fog, warm interior lights shining through large panoramic windows, tilt-shift lens, muted tones
Как видите, процесс довольно прозрачен.
Вредно ли добавлять шум?
Многие считают, что искусственное зерно портит высококачественный рендер, но на самом деле именно оптические артефакты заставляют цифровое чадо выглядеть достоверно. Идеальных фотографий в реальной физической природе не существует. Обязательно всплывут ошибки хроматической аберрации на краях контрастных объектов. Появится лёгкое виньетирование по углам. Не скупитесь на слова вроде «subtle color fringing» или «dust and scratches». Это добавит тот самый колоритный антураж, ради которого опытные пользователи часами сидят за мониторами. К тому же, лёгкий расфокус на заднем плане отлично скроет мелкие генеративные недочёты. Само собой, здесь требуется мера и крайне щепетильный подход. Настоящая фотография девятнадцатого века, созданная на стеклянных пластинах мокрым коллодионным способом (очень трудоёмкий процесс), требовала выдержки в несколько долгих минут. Сегодня генерация занимает миллисекунды. И всё же мы упорно пытаемся сымитировать несовершенства той ушедшей эпохи, чтобы окунуться в атмосферу плёночной романтики. В этом кроются обе стороны медали современных технологий, скрывающие свои подводные камни.
Грамотно собранная текстовая конструкция всегда окупает потраченные усилия. Смело экспериментируйте с искажениями, меняйте виртуальные объективы и не бойтесь загонять алгоритмы в рамки жёстких физических законов света. Тем более, что именно на стыке сухого машинного кода и авторского видения рождается настоящая внушительная магия. Удачи в поисках идеальной композиции, пусть каждый новый сгенерированный снимок твёрдо стоит на ногах в плане реализма, радует глаз и запомнится надолго. Перевоплощение завершено.