Промт для фото портрета

В сети довольно часто натыкаешься на красивые сгенерированные лица, от которых трудно оторвать взгляд. Кажется всё это предельно простым. Пару слов вбил — и шедевр выдала машина. В представлении многих обывателей достаточно указать пол и возраст персонажа, но на самом деле плоскую пластиковую куклу нейросеть тут же выдаст. Буквально десятилетие назад качественная цифровая ретушь была роскошью, но сейчас любой желающий может создать фотореалистичный кадр за три миллисекунды. Устав от суеты с бесконечными перегенерациями, опытные авторы начинают понимать ценность точных текстовых формулировок. И всё же ложка дёгтя кроется в том, что к порядку слов алгоритмы крайне капризны. Поэтому перед генерацией желательно чётко разложить по полочкам все переменные будущего шедевра.

Стоит ли усложнять конструкцию?

Рекой льются слова. Часто видишь километровые текстовые запросы, где смешано всё подряд. Работает ли такой подход? Да, иногда нейросеть творит чудеса, выдавая изысканный колоритный образ из случайного набора тегов. Однако чаще всего излишняя наляпистость только портит итоговый результат. Ведь машина просто путается в акцентах. Дело в том, что внимание алгоритма рассеивается, когда ему предлагают обработать восемь десятков параметров одновременно. С одной стороны, подробное описание внешности необходимо, с другой — важно вовремя остановиться. Не стоит перегружать начало запроса техническими терминами, лучше оставить их для финала. К слову, львиная доля успеха зависит именно от первых пяти слов. Начать нужно с самого объекта съёмки. А уже затем наслаивать детали одежды или особенности макияжа. Впрочем, иногда короткая фраза приносит куда больше пользы, чем внушительный многоэтажный абзац.

Базовый синтаксис для генерации

Тяжёлый объектив холодит руки. Именно такое ощущение должно возникать у алгоритма, когда он обрабатывает запрос на фотореализм. Начинается магия с указания крупности плана. Первым в композицию встраивается портрет по грудь, обозначенный термином medium shot. Затем следует более интимный close-up, акцентирующий внимание зрителя исключительно на лице модели. Ну и, наконец, экстремально крупный план выхватывает лишь глаза или губы персонажа. Естественно, без правильного освещения даже самый скрупулезный запрос выдаст удручающее зрелище. Свет солирует в любой фотографии. Рембрандтовское освещение или мягкий контровой свет моментально бросается в глаза своей кинематографичностью. К тому же, объёмный боковой свет создаёт тот самый самобытный антураж, о котором грезят многие творцы. Нужно отметить, что использование связки «RAW photo» вместе с названием конкретной камеры значительно повышает шансы на успех. Да и самой нейросети так комфортнее понимать желаемый уровень детализации.

Как выбрать оптику и освещение?

Это серьёзное вложение. Ведь качественная виртуальная техника требует точного понимания физики процесса. Достаточно ли написать «красивое фото»? Вовсе нет, машина тяготеет к конкретике. Исконно фотографические термины работают лучше всего. К примеру, плёнка Kodak Portra 400 была выпущена в тысяча девятьсот девяносто восьмом году, однако её тёплые оттенки до сих пор сводят с ума эстетов по всему миру. Кожа модели приобретёт реалистичную текстуру с лёгким благородным зерном, если добавить это название в текст. Тем более, что цифровой шум отлично маскирует пластиковость ИИ-генераций. Не стоит скупиться на указание фокусного расстояния. Объектив с фокусным расстоянием восемьдесят пять миллиметров, отлитый из первоклассного стекла, снабжённый широкой диафрагмой, традиционно считается лучшим выбором для нашей задачи. Лучше отказаться от широкоугольной оптики, если нет желания получить вычурный искажённый нос. Безусловно, диафрагма f/1.8 размоет задний фон в красивое боке.

Эмоции и скрытые детали

Прядь волос небрежно падает на лоб. С таких незначительных деталей обычно начинается формирование живого образа. Эмоции превращают мёртвый пиксельный массив в осмысленный взгляд. Стоит отметить, что стандартная «милая улыбка» довольно часто выглядит пугающе неестественно. Разумеется, лучше использовать более сложные состояния. Лёгкая меланхолия или искренняя усталость добавят кадру той самой глубины. А вот если облачить модель в текстурную одежду, результат станет ещё более впечатляющим. Вязаный грубый свитер или льняная помятая рубашка дадут алгоритму повод прорисовать мелкие ворсинки. Вся суть в том, что нейросети нужны зацепки для создания микроконтраста. Нельзя не упомянуть про дефекты кожи, которые многие старательно стирают. Идеально гладкие лица давно стали признаком дурного тона в среде профессионалов. Веснушки и мелкие морщинки — всё это своеобразный спасательный круг для искателей максимальной реалистичности. Ведь именно такой подход уверенно стоит на ногах в современной цифровой среде.

Портреты в стиле гранж: Нюансы

Сложно ли вписать модель в окружение? Да, но без этого кадр часто выглядит студийно-стерильным. Размытый фон ночного Токио моментально приковывает внимание. И всё же, баланс соблюдать необходимо. Наляпистость заднего плана может оттянуть на себя интерес зрителя. Компактное решение — использовать нейтральные текстурные фоны. Бетонная влажная стена или бархатная тёмная драпировка отлично справятся с задачей. Кстати, погода тоже вносит свою лепту. Мягкий рассеянный свет в пасмурный день, когда температура падает до десяти градусов по Цельсию (иногда ниже), создаёт идеальные условия для съёмки. Тени становятся мягкими, а контраст снижается. Само собой, в промте можно прямо указать «overcast weather». Всплывут ли ошибки при генерации? Обязательно. Порой на фоне появляются странные артефакты. Махинации с негативным промтом помогут отсечь этот мусор. Ну и, конечно же, не стоит забывать про соотношение сторон.

Стилизация

Порядок имеет значение. Потому что проверено. Годами. В начале всегда идёт ядро запроса, описывающее медиум и объект. Далее следует детализация внешности, а затем освещение и технические параметры камеры. Венчает эту конструкцию набор стилистических модификаторов. Например, промт может звучать так:

«Fashion portrait photography of a 30-year-old ginger woman, wearing a green silk dress, soft cinematic lighting, shot on 35mm lens, Kodak Gold 200, highly detailed»

Настоящий кладезь знаний для любителей щепетильного подхода. Конечно, этот добротный бюджетный вариант не сильно ударит по кошельку при трате токенов (буквально пару центов), но результат поразит своей проработанностью. Обе стороны медали здесь очевидны. Слишком короткий текст даст волю фантазии машины, а слишком длинный — свяжет ей руки. Если вы генерируете портрет через платные сервисы, кошелёк станет легче довольно быстро из-за переизбытка лишних слов. Ну, а истина, как всегда, где-то посередине. Местный бомонд нейрохудожников давно вывел свои постулаты идеального баланса.

Стоит ли использовать имена художников?

А если ещё вспомнить про визуальные отсылки? Использование имён известных фотографов в запросе — излюбленный трюк авторов. Фотография в стиле Питера Линдберга моментально обретёт драматичный чёрно-белый контраст. Да и сами алгоритмы прекрасно обучены на работах классиков. Однако слепое копирование чужого стиля — неоднозначный путь. Настоящая изюминка появляется тогда, когда вы смешиваете несочетаемое. Например, грандиозный свет в стиле Грегори Крюдсона, применённый к повседневному стрит-фото. Пыль, витающая в воздухе, постепенно оседает на плечах модели, создавая невероятный объём. Это же правило касается и кинорежиссёров. Безусловно, подводные камни есть и здесь. Машина может слишком буквально воспринять указания и выдать карикатуру. Поэтому не стоит перебарщивать с весами таких тегов. Тем более, если заказчик хочет видеть своё чадо в максимально реалистичном виде. Лучше отказаться от десятка имён, оставив лишь одно. Чтобы полностью окунуться в этот процесс, потребуется время. Иначе бесконечные генерации серьёзно бьют по бюджету.

Смелые эксперименты с текстом всегда вознаграждаются неожиданными визуальными открытиями. Каждое слово в запросе имеет вес, и только через ошибки можно нащупать тот самый баланс формы и содержания. Нет смысла слепо копировать чужие длинные формулы, куда правильнее собрать собственный набор переменных. Стоит пробовать новые стилистические связки, менять виртуальную оптику, играть с искусственным освещением и не бояться выходить за рамки привычных шаблонов. Пусть каждый сгенерированный кадр радует глубокой детализацией, а процесс создания приносит только неподдельное удовольствие.