Промты для генерации фотографий (с примерами готовых промтов)

В сети представлено множество завораживающих картинок, созданных искусственным интеллектом, однако обыватель часто разочаровывается, получая вместо шедевра мыльное пластиковое пятно. Плохой результат — это не всегда вина алгоритма, которому не хватило вычислительных мощностей. Буквально несколько лет назад генерация изображений казалась забавой для гиков, но сейчас вся эта индустрия твёрдо стоит на ногах, требуя от пользователя профессиональных навыков. А ведь многие считают нейросеть неким волшебным джинном, читающим мысли, но на самом деле бездушное железо нуждается в предельно точных инструкциях. Но чтобы не ошибиться и получить добротный снимок, нужно научиться правильно конструировать текстовый запрос.

С чего начинается магия?

Размытый задний фон, фокус на влажных ресницах, мягкий тёплый свет от окна справа. Именно так мыслит опытный фотограф, нажимая на спуск затвора в студии. И нейросеть тоже тяготеет к подобному структурному мышлению. Базовые постулаты гласят, что запрос строится по принципу наслоения смыслов, где каждое слово должно внести свою лепту в итоговый результат. Сначала задаётся сам субъект, затем описывается его окружение, после чего в дело вступают технические параметры виртуальной камеры. К слову, стоит избегать чрезмерной наляпистости, когда в одну строку пытаются впихнуть десяток разных эпох и стилей. Это же правило касается и мелких деталей. Ведь алгоритм просто сойдёт с ума, пытаясь угодить всем противоречивым требованиям сразу. А вот скрупулёзный подход творит чудеса.

Как настроить освещение?

Задача не из лёгких. Ведь свет в фотографии решает абсолютно всё. Свет буквально льётся рекой на лицо модели, если добавить в строку фразу «cinematic lighting» или «golden hour». С тенями дело обстоит немного сложнее, но именно контраст солирует в кадре, создавая нужный драматичный антураж. Разумеется, лучше отказаться от абстрактных понятий в пользу конкретики. Указание физических параметров, усиленных упоминанием студийного оборудования, отлитого из прочного пластика, снабжённого серебристыми отражателями, даёт алгоритму мощный вектор. Запрос:

shot on 35mm lens, f/1.8, 8k resolution, softbox lighting

Мгновенно преображает плоскую картинку, а кошелёк станет легче разве что на стоимость подписки, хотя аренда реального оборудования — это всегда серьёзное вложение. И всё же, главное — угадать с балансом белого.

Портретная съёмка: щепетильный процесс

Что насчёт генерации людей? Выглядит впечатляюще, когда на лице видны микроскопические поры кожи и лёгкий пушок на щеках. Чтобы получить такой самобытный и живой результат, стоит использовать формулу с акцентом на реалистичную текстуру. Начинать нужно с описания внешности. Пример отличного промта звучит так:

close-up portrait of a 35-year-old scandinavian man, rugged face, messy hair, wearing a dark wool coat, natural overcast daylight, photorealistic, 8k, highly detailed, sharp focus, skin texture

Здесь изюминка кроется в деталях. С одной стороны, мы даём свободу искусственному интеллекту, с другой — жёстко фиксируем возраст, фактуру ткани и тип освещения. К тому же, не стоит забывать про микроконтраст. Фразы вроде «subtle blemishes» работают как настоящий спасательный круг, избавляя лицо от жуткого эффекта фарфоровой куклы. Да и самим виртуальным персонажам так добавляется характера.

Пейзажи Исландии: северный колорит

Природа не терпит суеты. Завораживающий грандиозный пейзаж всегда требует глубокого пространственного мышления. В представлении многих генерация гор происходит по одному щелчку мыши, однако подводные камни обязательно всплывут при попытке получить физически корректную воду или реалистичные облака. Исконно холодная красота передаётся через сложные атмосферные явления. Попробуйте скормить системе такую строку:

epic landscape of icelandic black sand beach at dawn, crashing ocean waves, low fog over cold dark water, dramatic storm clouds, cinematic drone shot, hyperrealistic, volumetric lighting

Вся суть в том, что мы указываем не только географическую привязку, но и суровое состояние погоды. Величественные тёмные скалы, прорезанные глубокими трещинами, окутанные утренним туманом, подсвеченные первыми лучами солнца… Такие неоднозначные детали всегда приковывают внимание зрителя. Тем более, что пейзажи редко требуют огромных вычислительных затрат, в отличие от сложных композиций с толпой людей.

Фуд-фотография

Грезят ли рестораторы о таких снимках без затрат на студию? Безусловно. Съёмка еды — это весьма вычурный жанр, где малейшая ошибка мгновенно превращает свежий стейк в кусок расплавленного пластилина. Чтобы блюдо выглядело аппетитно, стоит оперировать терминами профессиональных фуд-стилистов. Отличной базой послужит такой текст:

commercial food photography of a juicy beef burger, melting cheddar cheese, fresh crisp lettuce, flying sesame seeds, dark rustic wooden table, dark moody style, sharp studio lighting, macro lens, 8k octane render

Здесь венчает композицию динамика и глубина резкости. Разлетающиеся кунжутные семечки или капли соуса, вырванные из пространства мощным импульсным светом, запечатлённые на долю секунды, делают кадр невероятно реалистичным. Не скупитесь на описание фактур. Глянцевая поверхность горячей булочки или грубая матовая текстура деревянной доски — эти мелочи формируют общее восприятие. А покупка подписки на нейросеть не сильно ударит по кошельку, в отличие от гонорара всей съёмочной команды.

Стрит-фотография: городская динамика

Ритм мегаполиса. Уловить его сложно даже живому репортёру с хорошей камерой. А как объяснить программе, что такое решающий момент Брессона? Буквально несколько лет назад алгоритмы выдавали жуткую кашу из людей на заднем фоне (иногда с лишними конечностями), но сейчас ситуация кардинально изменилась. Для стрит-фотографии критически важен эффект присутствия и лёгкой визуальной небрежности. Хороший старт даст такой промт:

street photography, busy tokyo intersection at night, neon lights reflecting in wet puddles, a lonely figure with an umbrella walking away, beautiful bokeh, shot on Fujifilm X-T4, grainy film, realistic

Здесь весь творческий бомонд оценивает параметр «grainy film», который добавляет кадру изысканный цифровой шум. Это позволяет окунуться в атмосферу старой доброй репортажной съёмки. Естественно, стоит приготовиться к тому, что лица случайных прохожих могут оказаться слегка смазанными. Впрочем, для жанра уличной фотографии это скорее плюс, чем очевидная ложка дёгтя.

Архитектура

Любые махинации с пространством требуют чёткой геометрии. Зрелище удручающее, когда кирпичные стены на картинке заваливаются внутрь, нарушая гравитацию. Чтобы избежать такого обидного фиаско, стоит использовать профессиональные архитектурные термины. Запрос:

interior design of a modern loft apartment, exposed brick walls, warm yellow lighting, large panoramic windows, minimalist wooden furniture, architectural photography, symmetrical composition, wide-angle lens

Сразу позволяет разложить всё по полочкам. Особый интерес тут вызывает параметр симметрии, который заставляет алгоритм жёстко выравнивать все вертикали в кадре. Нельзя не упомянуть и фокусное расстояние. Использование широкого угла обзора заметно расширит виртуальное пространство, позволив захватить внушительный кусок интерьера. А если заставить модель облачиться во что-то яркое на фоне серых стен, то контраст мгновенно бросается в глаза.

Отрицательные текстовые команды

Уродливые руки, мутные глаза, лишние пальцы и слипшиеся волосы. От всего этого визуального мусора нужно избавляться ещё на этапе планирования. Обязательно ли писать так называемый негативный промт? Вовсе нет, но без него результат будет напоминать лотерею. Обе стороны медали всегда должны быть учтены в работе промпт-инженера. В специальное поле обычно вписывают то, чего на итоговой фотографии быть категорически не должно. Типичный надёжный набор включает в себя слова:

ugly, deformed, blurry, bad anatomy, disfigured, cartoon, painting, illustration, watermark, text

Это своеобразный санитарный контроль для системы. Дело в том, что база обучения машин содержит терабайты детских рисунков, некачественных скетчей и 3D-моделей, а нам нужна стопроцентная фотореалистичность. Поэтому безжалостное отсечение всего рисованного становится критически важным шагом. Часто натыкаешься на откровенный брак именно из-за игнорирования этого правила.

Создание реалистичных изображений требует огромного терпения и постоянных экспериментов со словарём. Не бойтесь менять параметры объективов, играть с направлением солнечных лучей и добавлять нестандартные погодные условия в свои текстовые конструкции. Обычно львиная доля туристов оседает в популярных локациях вроде Парижа, но с помощью алгоритма ваше цифровое чадо может оказаться на поверхности Марса, сфотографированное на плёнку семидесятых годов. Эта формула — настоящий кладезь знаний для тех, кто готов учиться. Сохраняйте удачные связки слов, комбинируйте их между собой и создавайте свою личную библиотеку визуальных ключей. Удачи в бесконечных поисках идеального кадра, который обязательно поразит воображение ваших подписчиков!