Реалистичные промты для фото

В сети представлено множество однотипных генераций с идеальными пластиковыми лицами. Устав от суеты вылизанного глянца, опытные креаторы постоянно ищут способы заставить нейросеть выдать настоящую, несовершенную картинку. Плохой результат – это не всегда вина самого движка. Многим кажется, что машина просто не способна на сложную детализацию, но на самом деле проблема кроется в непонимании алгоритмов машинного зрения. А начать стоит с радикального пересмотра структуры текстового запроса.

Стоит ли усложнять?

Зависит ли реализм от длины текста? Вовсе нет. Задача не из лёгких. Буквально год назад длинные описания считались нормой, но сейчас алгоритмы понимают всё с полуслова. Обыватель привык писать целые поэмы, надеясь на чудо. Однако львиная доля этих эпитетов просто игнорируется математической моделью. Ведь именно перегруз лишними деталями создаёт ту самую визуальную кашу. Сначала движок пытается отрисовать передний план. Далее следует робкая попытка увязать фон с объектом. Ну и, наконец, происходит наложение света, где генератор окончательно сдаётся под тяжестью противоречивых команд. Лучше отказаться от излишней детализации. Это же правило касается любых попыток описать эмоции чрезмерно сложными литературными конструкциями.

Портретная съёмка: Студийный свет

Крошечная капля пота на виске. Именно с такой мелкой детали начинается глубокое погружение в фотореализм. Сложно ли имитировать профессиональную студию? Да, но результат того стоит. Безусловно, правильное освещение творит чудеса. Сцена, освещённая мощным октобоксом, дополненная жёстким контровым лучом, всегда выглядит выигрышно. К слову, холодный резкий свет от вспышки «в лоб» отлично подчёркивает текстуру кожи. Изюминка кроется в указании конкретных брендов реального оборудования. Например, связка слов «Profoto B ten» моментально задаёт нужный антураж. И всё-таки не стоит забывать про тени. Глубокие чёрные провалы на скулах добавят драмы. Да и самим алгоритмам комфортнее работать с высоким контрастом.

Оптика

Начинать нужно с объектива. Это основа. Фотоаппарат Leica M6 был представлен публике в тысяча девятьсот восемьдесят четвёртом году, а его характерный рисунок до сих пор будоражит умы эстетов. При формировании команды упоминание этой камеры моментально меняет цветопередачу. Добротный винтажный объектив всегда добавляет картинке жизни. Нельзя не упомянуть фокусное расстояние. Тридцать пять миллиметров дают красивое искажение перспективы. Компактное решение – использовать полтинник для поясных портретов. Следующий важный критерий кроется в диафрагме. Значение «f slash one point two» гарантирует красивое размытие. Естественно, задник превращается в мягкое сливочное пятно. А вот оригинальное название плёнки вроде «Fujifilm Superia» заставит оттенки заиграть по-новому.

Как добиться текстуры кожи?

Вся суть в том, что генераторы по умолчанию безжалостно сглаживают цифровой шум. Пытаясь создать изысканный портрет, пользователи часто получают восковую куклу. Не стоит перебарщивать с эпитетами вроде «beautiful» или «perfect». Наляпистость таких слов моментально убивает реализм. Спасательный круг кроется в использовании негативных промтов. Сюда обязательно вписываются термины «airbrushed» и «retouched». К первой группе позитивных команд относится фраза «skin pores». Отдельно стоит упомянуть команду «peach fuzz», которая генерирует микроскопический пушок на щеках. Разумеется, такие махинации с текстом требуют скрупулёзного подхода. Иначе на лице модели всплывут жуткие артефакты.

Улицы Токио: Ночной неон

Мерцающий свет вывески отражается в луже. Зрелище поистине впечатляющее. Добиться кинематографичной картинки здесь довольно сложно. Местный бомонд, гуляющий по Синдзюку, тяготеет к тёмным тонам одежды. Заставляя модель облачиться в чёрный плащ, нет смысла переплачивать токенами за генерацию сложного фона. Центр композиции должен оставаться тёмным. Колоритный неоновый свет сам прорисует контуры. В запросе солирует фраза «cinematic street photography». Впрочем, здесь есть свои подводные камни. Машина часто выдаёт слишком вычурный киберпанк, игнорируя реальность. Ложка дёгтя заключается в излишней чистоте улиц. Поэтому в промт смело вносится словосочетание «grimy asphalt». Это не сильно ударит по кошельку вашего времени, но добавит достоверности. Ну, а проливной дождь окончательно закрепит атмосферу.

Чем плёночная эстетика лучше цифровой?

Многие считают зерно техническим браком, но на самом деле именно оно придаёт изображению душу. Когда-то давно идеально чистая картинка была роскошью, однако сейчас цифровой шум стал признаком элитарности. Самобытный характер плёнки кроется в её несовершенствах. Старые мануалы Кодак – настоящий кладезь информации для составления промтов. Указание «ISO eight hundred» добавит крупное зерно. Далее следует команда «light leaks», имитирующая засветки. Последним в списке идёт запрос «halation», который создаёт характерное красное свечение вокруг ярких объектов. Тем более что эти эффекты отлично скрывают мелкие ошибки нейросети в анатомии. Обе стороны медали здесь очевидны: мы теряем звенящую резкость, но приобретаем магию. Свет из окна льётся рекой, мягко обволакивая силуэт.

Ошибки композиции

Центральное расположение объекта бросается в глаза сразу. Искусственный интеллект обожает симметрию, а этот факт часто выдаёт его с головой. Приходится искусственно ломать идеальные пропорции. Для этого в запросе чётко прописывается «rule of thirds» или «Dutch angle». Слегка заваленный горизонт творит чудеса восприятия. Конечно, иногда симметрия оправдана, однако в репортажной съёмке она выглядит неестественно. Спонтанность кадра венчает фраза «candid shot». Никто не позирует в камеру. Случайный прохожий просто натыкаешься на объектив (буквально на долю секунды). Грандиозный масштаб архитектуры лучше подчёркивать с нижней точки, используя «low angle shot». Нужно отметить, что такие ракурсы требуют указания короткофокусной оптики.

Рендеринг

С воздухообменом дело обстоит сложнее, если мы говорим про макросъёмку еды. Пар над чашкой кофе ИИ часто рисует в виде плотного пластикового облака. Исконно правильный подход заключается в имитации физических движков. Обычные пользователи редко задумываются о таком. А если ещё вспомнить про трассировку лучей, то картинка становится неотличимой от реальности. Слова «octane render» и «global illumination» работают безотказно. К тому же, добавление команды «subsurface scattering» позволяет свету проникать сквозь материалы. Это критически важно для рендера винограда, сыра или человеческого уха. Свет должен рассеиваться внутри объекта. Само собой, генерация таких сложных текстур – серьёзное вложение вычислительных мощностей. Кошелёк станет легче, если использовать платные версии нейросетей на максимальных настройках. Но результат заслуживает истинного уважения.

Детализация гардероба

Ткань имеет свой уникальный вес. Тяжёлый бархат спадает крупными складками, тонкий шёлк струится по телу. Забывая указать материал, авторы получают невнятную синтетику. Щепетильный подход к описанию одежды моментально повышает уровень работы. Наряд для избранных. Вместо банального «красного платья» лучше писать «burgundy heavy linen dress». Мятая текстура льна добавит недостающую фактуру. Кроме того, стоит упомянуть дефекты. Потёртый воротник, оторванная пуговица, торчащая нитка. Жизнь состоит из таких мелочей. Пылинки в воздухе уверенно завершают композицию. Виртуальная пыль оседает на плечах героя. Да и зритель охотнее верит картинке, которую можно мысленно потрогать. Всё-таки нейросети – это лишь инструмент, а управляет им человеческая фантазия.

Удачи в поиске того самого идеального шума и пусть каждый ваш новый запрос обрывается на самой интригующей ноте, заставляя алгоритмы работать на пределе своих возможностей.