В сети представлено множество невероятно реалистичных картинок, сгенерированных нейросетями, и обыватель часто думает, что для такого результата достаточно просто описать желаемый предмет. Буквально десятилетие назад создание цифровой иллюстрации требовало долгих часов работы кистью на графическом планшете, но сейчас искусственный интеллект всё делает за секунды. Многие считают, что магия кроется в сложных словесных конструкциях, но на самом деле львиная доля успеха зависит от понимания виртуальной оптики. Ведь именно виртуальный объектив формирует финальный антураж изображения. Однако чтобы не ошибиться с композицией, нужно обязательно освоить язык профессиональных фотографов и операторов.
Как выбрать ракурс?
С лёгкого щелчка затвора начинается магия, когда свет проникает через линзу и оседает на матрице цифрового устройства. С чего начинается выбор подходящего описания для нейросети? С определения крупности плана. Одним из самых популярных видов съёмки считается так называемый «Close-up shot», когда лицо персонажа или мелкая деталь солирует в кадре, заполняя собой почти всё пространство. Далее следует поясной портрет, известный в англоязычной среде как «Medium shot». К слову, именно этот формат чаще всего тяготеет к классической портретной фотографии. А вот для масштабных сцен отлично подойдёт «Extreme long shot», когда человек превращается в едва заметную точку на фоне внушительного самобытного пейзажа. Разумеется, алгоритмы понимают эти термины буквально. Поэтому не стоит пренебрегать точным указанием дистанции между виртуальным зрителем и объектом.
Плёночная эстетика в нейросетях
Мягкое зерно на фотографии. Оно всегда приковывает внимание. Эстетичны ли такие кадры? Само по себе искусственное состаривание может выглядеть дёшево, но правильное упоминание конкретной модели фотоаппарата творит чудеса. Исконно аналоговая техника вроде легендарной «Leica M6» придаёт картинке благородную мягкость. Тем более, что нейросети отлично знают, как именно эта немецкая оптика искажает свет по краям кадра. Следующий важный критерий — тип плёнки. Отдельно стоит упомянуть «Kodak Portra 400». Ведь именно этот материал исторически славится идеальной передачей оттенков человеческой кожи. Буквально в шестидесятые годы прошлого века фотографы массово переходили на цветную химию, а сегодня мы просто вписываем эти названия в строку ввода. Безусловно, процесс не сложный, но кропотливый, требующий постоянных экспериментов с параметрами.
Фокусное расстояние
Это важнейший нюанс. Потому что он меняет всё. Обычная цифровая наляпистость часто возникает из-за того, что автор текста забыл указать миллиметры. Вся суть в том, что объектив с фокусным расстоянием восемьдесят пять миллиметров безжалостно размывает задний фон. Это связано с тем, что узкий угол обзора буквально спрессовывает пространство. И всё же для пейзажей лучше подойдёт широкая оптика на четырнадцать или двадцать четыре миллиметра. Конечно, перспектива при этом может слегка искажаться, однако масштабность сцены будет передана великолепно. Не стоит перебарщивать со сверхширокоугольными линзами типа «рыбий глаз» (восемь миллиметров), если нет цели создать карикатурное искажение. Кстати, именно такие махинации с миллиметрами часто применяют в рекламной съёмке автомобилей, чтобы капот казался более агрессивным.
Стоит ли экономить на деталях?
Вопрос риторический, когда дело касается освещения и параметров диафрагмы. Многие новички просто пишут «красивый свет», и это огромная ложка дёгтя в их работе. Алгоритм в таком случае выдаёт стандартную студийную заливку. Натыкаешься на такие работы довольно часто. А если ещё вспомнить про значение апертуры, то картинка становится по-настоящему живой. Значение «f/1.8» создаст тот самый изысканный колоритный эффект боке, когда светящиеся огоньки на заднем плане превращаются в размытые кружочки. К тому же открытая диафрагма всегда добавляет изображению воздуха. Впрочем, если нужна идеальная резкость по всему полю кадра, лучше отказаться от таких значений и прописать «f/8» или «f/11».
Это тяжёлый, но эффективный способ контролировать глубину резкости без дополнительных текстовых костылей.
Студии Голливуда: кинематографический свет
Свет на площадке льётся рекой, софиты нагревают воздух до пятидесяти градусов по Цельсию. Подобный антураж мы можем легко воссоздать в «Midjourney» или «Stable Diffusion», если обратимся к опыту западного кинематографа. В представлении многих достаточно написать «cinematic lighting», однако спектр объектов не ограничивается одной фразой. Чтобы внести лепту в создание шедевра, стоит добавить упоминание освещения Рембрандта, прорисовывающее драматичный треугольник света на щеке персонажа. Естественно, для усиления эффекта желательно сослаться на режиссёрский стиль, вписав «directed by Denis Villeneuve» или «cinematography by Roger Deakins».
Да и самим алгоритмам комфортнее работать с чёткими стилистическими референсами, которые давно разложены по полочкам в их базах данных.
Ведь тот же бомонд кинематографистов десятилетиями формировал визуальные постулаты, которые теперь служат нам отличными подскапами. Ну и, конечно же, не нужно забывать про цветовую температуру в Кельвинах.
Примеры готовых запросов
Сложно ли сразу собрать рабочий запрос? Да, но практика расставляет всё на свои места. Разберём первый вариант, созданный для портретной съёмки. Строка может выглядеть так:
близкий портрет молодой женщины с веснушками, снятый на камеру «Sony A7R IV», с объективом на восемьдесят пять миллиметров, диафрагма f/1.4, освещение мягкое утреннее, плёнка «Fujifilm Superia», высокая детализация.
Этот добротный бюджетный вариант конструкции почти не бьёт по бюджету токенов, но выдаёт потрясающий результат. Далее идёт архитектурный пейзаж. Формулируем текст, прописывая:
заброшенный готический замок в тумане, зафиксированный на дрон «DJI Mavic 3», широкий угол двадцать четыре миллиметра, пасмурная погода, цветокоррекция в холодных тонах.
Заслуживает истинного уважения и макросъёмка. Здесь отлично сработает запрос на:
макро фотографию капли росы на зелёном листе, сделанную на «Canon EOS R5», объектив сто миллиметров макро, диафрагма f/2.8, кольцевая вспышка, студийный чёрный фон.
Как видим, в каждом случае виртуальная фотокамера становится главным инструментом, а точные параметры оптики венчают текстовую композицию. Ну, а подводные камни всегда всплывут, если проигнорировать эти технические моменты.
Где скрывается изюминка винтажа?
Неоднозначный тренд на ретро продолжает набирать обороты. Многие пользователи искусственного интеллекта грезят о создании идеальных полароидных снимков, ведь эта эстетика обладает невероятным шармом. Само собой, здесь нужен скрупулёзный подход к написанию промта. Нужно отметить, что указание «Polaroid SX-70» сразу добавляет характерную блёклую рамку и тёплые, слегка выцветшие тона. Кроме того, чтобы ваше цифровое чадо выглядело максимально правдоподобно, желательно прописать наличие лёгких засветок (light leaks) и потёртостей на бумаге. Вычурный студийный свет здесь будет совершенно лишним, лучше выбрать естественное уличное освещение. Не сильно ударит по кошельку ваших вычислительных мощностей и генерация кадров с имитацией старой кассетной видеокамеры VHS. Зрелище удручающее в плане детализации, однако атмосфера ностальгии передаётся просто великолепно. Такой грандиозный щепетильный подход позволяет создавать не просто картинки, а настоящие истории с эффектом документальности.
И нельзя не упомянуть, что именно несовершенства техники делают цифровую иллюзию по-настоящему живой.
Экзотические форматы съёмки
С объективом для микроскопа дело обстоит сложнее. Когда хочется окунуться в мир макроструктур, обычные настройки фокусного расстояния перестают работать. Настоящий спасательный круг в таких случаях — использование терминов вроде «scanning electron microscope» или сокращённо SEM. Картинка мгновенно приобретает тот самый монохромный, глубоко детализированный вид, который сразу бросается в глаза. Обе стороны медали здесь таковы: с одной стороны, получается невероятно научный вид, с другой — теряется возможность управлять цветом. Если же нужно, чтобы персонаж смог облачиться в специфическую ауру скрытого наблюдения, стоит попробовать тексты с упоминанием камер видеонаблюдения (CCTV camera footage). Это серьёзное вложение в атмосферу киберпанка или городского детектива. Изображение будет изобиловать характерными помехами, а ракурс сверху вниз, типичный для систем безопасности, прочно стоит на ногах в жанре урбанистического триллера. Ну и, наконец, для эффекта съёмки с видеорегистратора отлично подойдёт фраза «dashcam footage».
Скорость затвора
Ещё один важнейший параметр. Который часто игнорируют. Когда нейрохудожник пытается изобразить мчащийся спорткар, отсутствие упоминания выдержки может всё испортить. Кошелёк станет легче от потраченного впустую времени, если не указать «fast shutter speed» или конкретное значение вроде «1/1000s». Именно короткая выдержка замораживает движение, делая брызги воды или летящую пыль кристально чёткими. А вот для создания эффекта размытого движения в ночном городе, когда фары автомобилей превращаются в длинные красные и белые линии, потребуется длинная выдержка (long exposure).
Буквально в эпоху плёночных фотоаппаратов мастерам приходилось использовать тяжёлые штативы и спусковые тросики, чтобы камера не дрогнула в течение нескольких секунд.
Нынешним же креаторам этот кладезь визуальных эффектов доступен по одному клику. Это же правило касается съёмки бурных водопадов, где струи воды приобретают гладкую шелковистую текстуру.
Улицы Токио: неоновый нуар
Влажный асфальт после дождя, отражающий яркие вывески. Выглядит впечатляюще. Воссоздать подобную атмосферу помогает правильная связка объектива и источника света. Не стоит гнаться за сложными текстовыми конструкциями, когда можно просто указать «neon lighting» в сочетании с линзой на пятьдесят миллиметров. Исторически сложилось так, что именно «полтинник» считается стандартом уличной фотографии, так как его угол обзора максимально приближен к человеческому глазу. Когда-то тихое место сейчас превратилось в сияющий мегаполис, и чтобы передать эту динамику, желательно добавлять в промт анаморфотную оптику (anamorphic lens). Такое стекло растягивает блики от фонарей по горизонтали, создавая эффект дорогого научно-фантастического кино. Да и самим персонажам в кадре этот приём добавляет масштабной эпичности. Высокий собор или стеклянный небоскрёб на заднем плане при этом приобретут красивое бочкообразное искажение.
Эксперименты с виртуальной оптикой открывают совершенно новые горизонты для творчества. Не стоит бояться комбинировать винтажные объективы с ультрасовременным освещением или помещать плёночные камеры в фантастические локации. Важно помнить, что каждый добавленный параметр, будь то диафрагма или фокусное расстояние, полностью меняет настроение финальной работы. Достаточно практиковаться, собирать свою личную библиотеку удачных настроек, и каждая новая генерация обязательно станет отличным решением!