Пример промта для фотографии (с примерами готовых промтов)

В сети полно невероятно красивых изображений, сгенерированных искусственным интеллектом, однако на практике обыватель часто получает лишь невнятные картинки с лишними пальцами и кривыми лицами. Буквально пару лет назад это было забавной игрушкой для узкого круга гиков, но сейчас нейросети превратились в серьёзный рабочий инструмент. Казалось бы, достаточно просто написать пару слов, однако машина мыслит совершенно иными категориями, отличными от человеческого восприятия. Львиная доля успеха зависит именно от правильного текстового запроса, ведь набор символов должен стать настоящей инструкцией для капризного алгоритма. А начать стоит с понимания базовой логики формирования таких команд.

Чем генерация отличается от реальной съёмки?

Задача не из лёгких. Пиксели из хаоса собираются постепенно, шаг за шагом. Дело в том, что алгоритм не видит общую картину изначально, а опирается исключительно на знакомые ему визуальные паттерны, заложенные разработчиками. И всё же многие считают процесс настоящей магией, но на самом деле это скрупулёзный математический расчёт. Натыкаешься порой на откровенную наляпистость вместо ожидаемого шедевра, и руки мгновенно опускаются. Это связано с тем, что вычислительной машине банально не хватило конкретики. К слову, опытные инженеры тратят долгие часы на шлифовку одного единственного предложения. Ну, а новичку лучше отказаться от сложных философских понятий в пользу чётких физических свойств объекта.

Базовая структура

С чего начинается выбор правильных слов? С определения главного героя нашего кадра. Сначала мы задаём сам предмет или человека, затем описываем его ближайшее физическое окружение. Далее следует освещение, заданное параметрами вроде мягкого студийного софтбокса или резкого полуденного солнца. После этого вплетается стилистика камеры, имитирующая добротный современный объектив с фокусным расстоянием восемьдесят пять миллиметров. Последним в списке идёт цветокоррекция, прописанная через упоминание киноплёнки кодак или определённого именитого режиссёра. Впрочем, этот порядок не стоит считать абсолютной догмой, которую запрещено нарушать. Ведь нейросеть всё равно отдаст наивысший приоритет самым первым словам вашего текстового запроса.

Портрет в студии

Обычный серый фон. Часто именно с него стартуют тесты новых визуальных моделей. Эстетичны ли такие сухие генерации? Само по себе лицо без глубокого антуража не отличается особой красотой, но правильно выставленный свет творит настоящие чудеса. Стоит отметить, что для получения реалистичного портрета не стоит перегружать запрос лишними деталями одежды или вычурным сложным макияжем. Компактное решение – описать самые базовые вещи, оставив пространство для цифровой фантазии алгоритма. К примеру, рабочий запрос может звучать так:

«молодая женщина европейской внешности смотрит прямо в объектив, одета в белый льняной свитер, студийное освещение сбоку, тёмно-серый фон, текстура кожи детализирована до пор, снято на камеру сони альфа»

Естественно, результат порадует только в том случае, если вы не забудете указать высокое разрешение картинки.

Достопримечательности Японии: Киото

А вот с открыточными пейзажами дело обстоит гораздо сложнее. Исконно восточная архитектура требует совершенно иного подхода к освещению и выстраиванию композиции. Буквально десятилетие назад фотографы часами ждали правильного тумана у подножия священной горы, но сейчас нужную атмосферу создают исключительно текстовые команды. Разумеется, придётся внести свою лепту в описание погодных условий. Запрос формулируется довольно просто:

«старинный деревянный храм в Киото на рассвете, вокруг цветущая сакура, лёгкая утренняя дымка над прудом, кинематографичный мягкий свет, гиперреализм, соотношение сторон шестнадцать на девять»

Зрелище удручающее, если по ошибке не прописать освещение, поэтому не забудьте проверить наличие слов о рассвете или мягком закате. Тем более, что именно косые лучи солнца придают картинке тот самый колоритный самобытный вид.

Вредно ли усложнять команду?

Настоящий текстовый парадокс. Ведь чем больше слов вы пишете, тем больше шансов окончательно запутать алгоритм. С одной стороны, хочется расписать каждый мельчайший нюанс, с другой — важные элементы просто потеряются в бесконечном потоке букв. К тому же искусственный разум инстинктивно тяготеет к сильному упрощению композиции, безжалостно отбрасывая всё лишнее. Подводные камни обязательно всплывут тогда, когда вы попытаетесь добавить в кадр более трёх разных, абсолютно не связанных между собой людей. Да и самим сгенерированным персонажам комфортнее находиться в гордом одиночестве на виртуальном полотне. Нужно отметить, что оптимальная длина хорошего запроса колеблется в пределах сорока или пятидесяти точных слов. Ну и, конечно же, не стоит забывать про вес каждого отдельного термина, который можно усиливать специальными скобками.

Макросъёмка

Крошечные капли росы на зелёных лепестках. Именно так обычно выглядят самые эффектные тесты макрообъективов. Стоит ли экономить на деталях в этом конкретном случае? Вовсе нет. Здесь как раз солирует фактура поверхности. Описание должно быть максимально скрупулёзным, чтобы машина прорисовала каждую мелкую ворсинку. Один из самых популярных видов промта выглядит следующим образом:

«крупный план глаза зелёной древесной лягушки, макрообъектив сто миллиметров, диафрагма два и восемь, яркие блики на влажной коже, размытый тропический фон, восьмикратное сглаживание»

Выглядит впечатляюще, когда точный фокус приковывает внимание зрителя, заставляя его рассматривать изображение долгими часами.

Свадебное платье в морском стиле

Белоснежная ткань на прохладном ветру. Стилизовать фэшн-съёмку без реальной живой модели невероятно интересно. Сложно ли передать фактуру тонкого шёлка? Да, но результат определённо того стоит. Вся суть в том, что машина отлично понимает физику драпировки, если ей правильно на это указать. Рабочий вариант текста будет таким:

«изысканный свадебный наряд (с элементами морской тематики) на манекене, струящийся белый шёлк, вставки из голубого кружева, на фоне бушующего океана, пасмурное небо, мягкий рассеянный свет, журнальная фотография высокого качества»

Безусловно, такой искусственный антураж не сильно ударит по кошельку, в отличие от организации выездной фотосессии где-нибудь на отвесных скалах. Да и обе стороны медали здесь совершенно очевидны: экономия времени колоссальная, а качество выдачи стабильно поражает воображение.

Стиль гранж в интерьере

Потёртые кирпичные стены и обилие холодного металла. Архитектурные генерации всегда пользовались огромным спросом среди практикующих дизайнеров. Когда-то заброшенное тихое место сейчас превратилось в настоящую индустриальную сказку благодаря правильным словам. Задавая параметры комнаты, не скупитесь на глубокое описание текстур отделочных материалов. Проверенный промт выглядит так:

«просторная гостиная в стиле гранж, обнажённый керамический кирпич на стенах, винтажный кожаный диван (тёмно-коричневого цвета), большие окна в пол, металлические светильники, лучи света пробиваются сквозь пыльный воздух, архитектурная визуализация»

И всё-таки всегда помните о строгой геометрии пространства. Ведь именно она задаёт правильный масштаб всему спроектированному помещению.

Коммерческая фотография еды

Правильный выбор ракурса имеет решающее значение. А если ещё вспомнить про аппетитную ресторанную подачу, то задача усложняется многократно. В представлении многих обывателей генерация сочного бургера — это минутное дело. Однако пластилиновые блёклые котлеты и слипшийся неестественный сыр — довольно частые гости на мониторах неопытных новичков. Чтобы избежать подобных неприятных казусов, стоит обратиться к профессиональной терминологии фуд-фотографов. Практичный запрос строится вокруг визуальной сочности:

«сочный говяжий бургер на дубовой доске, расплавленный сыр чеддер стекает по краям, капли прохладной воды на свежем листе салата, тёмный рустикальный фон, контровой свет из окна, дымок над горячей булочкой, фуд-стайлинг»

Такая детализированная визуализация не потребует многочасовой возни с пинцетом и техническим глицерином на реальной душной кухне.

Как выбрать цвет?

За банальными цветовыми схемами огромный пласт возможностей скрывается, ведь это настоящий кладезь для творческого человека. К первой группе относится классический строгий монохром, где бал правит игра света и густой плотной тени. Отдельно стоит упомянуть модную индустрию с её вычурной глянцевой эстетикой. Изюминку кадру придаст упоминание конкретных видов старой плёнки. Например, запрос может звучать так:

«кинематографичный кадр в неоновом свете, девушка в кожаной куртке идёт по ночному Токио, проливной дождь, отражения вывесок в лужах, стиль киберпанк, снято на плёнку фуджифильм»

И всё-таки не скупитесь на упоминание желаемой густой атмосферы. Ведь именно она выступает главным невидимым связующим звеном всего сгенерированного кадра.

Санитарный контроль

Случайные цифровые артефакты. Они преследуют абсолютно каждого. Ведь алгоритмы пока что крайне несовершенны. Ложка дёгтя в виде шестого пальца на руке или жутко слившихся конечностей способна испортить даже самую грандиозную творческую задумку. Избежать этого на сто процентов практически невозможно, но минимизировать риски вполне реально. В этом отлично помогает так называемый негативный промт. Это — своеобразный спасительный фильтр, куда бережно вписываются нежелательные элементы композиции. Туда отправляются жуткие телесные мутации, мыльные размытые текстуры, водяные знаки фотостоков, неестественно обрезанные края. Не стоит сильно перебарщивать с отрицаниями, однако базовый набор из пары десятков стоп-слов станет отличным спасательным кругом в океане пикселей.

Искусство составления правильных текстовых команд требует определённого терпения и постоянных каждодневных экспериментов. Впрочем, освоив базовые нерушимые постулаты, вы сможете регулярно создавать поистине завораживающие цифровые полотна. Главное – не бояться пробовать совершенно новые комбинации слов, смешивать разные художественные стили, скрупулёзно изучать удачные работы других талантливых авторов. Удачи в ваших творческих изысканиях, пусть каждая новая генерация порадует глаз и станет отличным решением для будущих масштабных проектов!