Пример промта для фото

Устав от пластиковых лиц и мыльного фона, многие опытные пользователи часами бьются над идеальной формулировкой, хотя механика нейросетей требует совершенно иного подхода. Банальных советов в сети представлено огромное количество, однако когда дело доходит до тонкой настройки коммерческого кадра, львиная доля этих мануалов оказывается бесполезной. Когда-то хватало пары слов для получения забавной картинки, но сейчас алгоритмы жаждут математической точности, глубокого понимания фотографической базы и знания специфической терминологии. А начать стоит с разбора проверенных архитектурных конструкций, которые действительно творят чудеса при работе с диффузионными моделями.

Как выстроить освещение?

Задача не из лёгких. Ведь именно свет формирует объём и задаёт настроение всему кадру. Зачастую обыватель пишет просто про «красивое солнышко», но результат от таких махинаций выглядит откровенно удручающе. Чтобы получить по-настоящему добротный кинематографический результат, запрос должен содержать терминологию гаферов. К слову, отлично работает связка контрового света с мягким заполняющим источником. Рабочий кусок текста выглядит так:

освещение в стиле Рембрандта, тёплый боковой свет от окна, холодный синий контурный свет сзади, объёмные лучи в лёгкой дымке.

С одной стороны, машина получает чёткие координаты, с другой — оставляет пространство для случайности. Дело в том, что искусственный интеллект обучался на студийных фотографиях, где каждая лампа имеет своё название, мощность и строгую функцию.

Студийный портрет в эстетике гранж

Фокус на лице. С детализацией кожи дело обстоит сложнее всего, потому что алгоритм так и тяготеет к идеальному глянцу. Впрочем, разрушить эту наляпистость довольно просто. В основу ложится запрос, усиленный конкретными марками плёнки, снятый на среднеформатную камеру, дополненный эффектом зернистости. Текст может звучать так:

крупный план девушки с растрёпанными волосами, уставший взгляд, текстурированная кожа с мелкими веснушками, снято на Kodak Portra 400, объектив 85 миллиметров, диафрагма 1.4, резкие тени от жалюзи.

Не стоит забывать о негативных весах. Туда обязательно отправляется симметрия, чрезмерный контраст и студийная ретушь. Конечно, с первого раза идеального попадания не случится, однако на третьей-четвёртой итерации всплывут действительно колоритные, самобытные кадры.

Оптика

Царапины на передней линзе дают тот самый неповторимый блик. Именно с таких мелочей начинается осознанная работа с фокусным расстоянием. Буквально пару лет назад движки (даже самые продвинутые) игнорировали упоминание конкретных объективов, но сегодня это серьёзный инструмент контроля перспективы. Использование пятнадцатимиллиметрового фишая сильно исказит пространство, вытянув углы и сделав центр гипертрофированным. А вот если прописать старый советский Гелиос 44-2, то фон закрутится в характерное боке. Разумеется, не нужно перегружать запрос перечислением всех существующих стёкол. Достаточно выбрать одно стекло, которое солирует в кадре. Вся суть в том, что конфликт фокусных расстояний внутри одного предложения приводит к каше из пикселей.

Стоит ли усложнять композицию?

Абсолютно нет. Настоящий кладезь выразительности кроется в лаконичности. Многие считают, что добавление сотни прилагательных улучшит картинку, но на самом деле это лишь сбивает фокус внимания. Внушительный многострочный абзац система просто не переварит, выбросив половину деталей на обочину генерации. Куда эффективнее использовать метод слоистой архитектуры. Сначала прописывается главный объект, затем выстраивается геометрия окружения, а завершает всё это общая атмосфера. Настоящая изюминка хорошего промта — это ритм. Пример:

одинокая фигура в тумане, тёмный силуэт на фоне светящегося рекламного щита, мокрый асфальт, отражения неона, правило третей.

Здесь нет ничего лишнего. Да и самим машинам гораздо проще работать, когда постулаты композиции чётко разложены по полочкам.

Стрит-фотография в Токио: неоновый нуар

Атмосфера сырости приковывает внимание. Чтобы окунуться в этот антураж, потребуется специфический лексикон. Стандартное упоминание дождя даст лишь пару капель на одежде. Тем более, что мы ищем глубокий, мрачный нарратив. Запрос стоит сформулировать так:

оживлённый перекрёсток Сибуя, человек под прозрачным зонтом, размытое движение машин на выдержке в одну десятую секунды, свет от красных фонарей отражается в лужах, холодные оттенки синего, плёночная эстетика, снято на Leica M10.

Заслуживает истинного уважения то, как алгоритмы научились понимать физику отражений. Подобный грандиозный уровень детализации в реальной жизни сильно бьёт по бюджету продакшена, требуя перекрытия улиц и поливальных машин. Здесь же всё решается грамотной расстановкой текстовых акцентов. Главное — не использовать взаимоисключающие понятия вроде яркого полуденного солнца и свинцовых туч одновременно.

Предметная съёмка ювелирных изделий

Магия в деталях. При работе с макросъёмкой на первый план выходят текстуры и блики. Золото часто получается пластиковым, поэтому этот нюанс требует отдельной проработки. Отличным решением станет использование терминов из коммерческой рекламы. Попробуйте написать так:

кольцо с бриллиантом на тёмном сланце, макросъёмка, фокусный стекинг, жёсткий направленный свет сверху, мягкий заполняющий свет сбоку, искрящиеся грани камня, микроскопическая пыль в воздухе.

Всю эту конструкцию венчает указание на сверхвысокое разрешение. Естественно, создание такой картинки вживую — это серьёзное вложение сил и времени. Искусственная же генерация не сильно ударит по кошельку, хотя и потребует нескольких десятков попыток. Скрупулёзный подход к описанию материалов гарантирует, что металл будет выглядеть именно как металл.

Технический брак

Засветка плёнки спасает композицию. Именно она часто делает кадр живым. Весь фотографический бомонд давно гоняется за идеальным несовершенством, пытаясь уйти от стерильной цифровой картинки. Алгоритм изначально обучен делать красиво, поэтому заставить его ошибаться — та ещё задачка. Но есть один проверенный метод. Стоит добавить в запрос хроматические аберрации, виньетирование или эффект просроченной плёнки Fujifilm, как картинка моментально обретает душу. Тот самый спасательный круг для тех, кто устал от вылизанной графики, от которой рябит в глазах. Обе стороны медали здесь предельно ясны. С одной стороны — реализм, с другой — потеря резкости. Безусловно, с такими эффектами не стоит перебарщивать. Лучше отказаться от них при генерации каталожной одежды, где важна точная цветопередача ткани.

Как избежать пластиковых лиц?

Секрет кроется в асимметрии. Идеальные пропорции всегда выдают машинное происхождение картинки. Когда натыкаешься на очередное симметричное лицо эльфийской принцессы, сразу бросается в глаза искусственность происходящего. Внести лепту в реализм помогут описания мелких изъянов. Добавьте в текст упоминание неровной линии бровей, лёгкой асимметрии глаз, шрама на подбородке или растрепавшейся пряди волос. Например:

портрет пожилого мужчины, глубокие морщины вокруг глаз, лёгкая щетина, неравномерный загар, суровый взгляд исподлобья.

Такой неоднозначный, но мощный подход заставляет сетку отступить от заученных глянцевых шаблонов. Тем более, зритель подсознательно доверяет изображению, если видит в нём несовершенства, присущие реальному миру.

Отрицательные промты

Невидимый фундамент кадра. Многие начинающие авторы грезят о красивых результатах, совершенно забывая про блок негативного текста. А ведь именно он отсекает всё лишнее, работая как скульптурный резец. Туда стоит вписать не только банальные «уродливый» или «размытый», но и вполне конкретные фотографические ошибки: пересвеченное небо, заваленный горизонт, хроматический шум, лишние пальцы, 3D-рендер, водяные знаки, текст. Если вы добиваетесь исконно фотографического качества, обязательно исключите слова вроде «иллюстрация», «живопись», «векторная графика». Кошелёк станет легче от платных генераций, если игнорировать этот инструмент, пытаясь вытащить нужный стиль только за счёт позитивных формулировок. Положительный запрос строит здание, а негативный — убирает строительный мусор с площадки.

Работа с текстовыми запросами давно превратилась в изысканный вид современного искусства, требующий насмотренности, щепетильного подхода и колоссального терпения. Каждое слово здесь имеет вес, а каждая запятая способна изменить композицию до неузнаваемости. Не бойтесь экспериментировать с оптикой, ломать вычурный студийный свет и добавлять технический брак ради живости кадра. Создавайте свою личную библиотеку удачных формулировок, постоянно анализируя чужие удачные решения и подмечая детали. Удачи в поисках той самой, идеальной цепочки слов, которая превзойдёт все ожидания и запомнится надолго.