В сети представлено множество завораживающих изображений, где изысканные модели позируют на фоне роскошных автомобилей, и кажется, что за каждым таким кадром стоит работа целой команды: фотографа, стилиста, осветителя. Буквально пару лет назад это действительно было так. Однако сегодня львиная доля подобных шедевров создаётся с помощью нейросетей, которые способны воплотить в жизнь самую смелую фантазию. Но чтобы не ошибиться и получить действительно впечатляющий результат, нужно разложить по полочкам саму суть этого творческого процесса.
Что такое промт и как он работает?
Задача не из лёгких. В представлении многих обывателей, работа с искусственным интеллектом для генерации изображений сводится к простому запросу вроде «девушка у красной машины». На деле же всё гораздо сложнее. Промт — это не просто просьба, а скрупулёзно составленное техническое задание, настоящий кладезь деталей и уточнений. Нейросеть не обладает человеческой интуицией или чувством вкуса; она лишь следует инструкциям. Чем точнее и подробнее будет ваш запрос, тем выше шанс получить картинку, которая приковывает внимание.
Сложно ли это? И да, и нет. С одной стороны, освоение искусства промтинга требует практики и понимания того, как алгоритм интерпретирует те или иные слова. С другой – существуют базовые постулаты, освоив которые, можно сразу поднять качество своих генераций на новый уровень. Нужно отметить, что большинство популярных нейросетей (Midjourney, Stable Diffusion) лучше всего понимают английский язык, поэтому все запросы стоит формулировать именно на нём. Это не блажь, а техническая необходимость.
Базовые элементы хорошего запроса
С чего начинается создание цифрового шедевра? С определения ключевых составляющих будущей картины. Это фундамент, на котором будет строиться вся композиция. Во-первых, стоит детально описать главный объект – автомобиль. Недостаточно указать «спортивная машина». Уточните марку (если это важно), цвет, состояние. Возможно, это винтажный Ford Mustang 1967 года с облупившейся краской или футуристический концепт-кар с неоновой подсветкой. Каждая деталь имеет значение.
Далее следует персонаж. Кто он? Элегантная женщина в вечернем платье, облачённая в стиль film noir, или брутальный мужчина в косухе, будто сошедший с обложки рок-журнала? Стоит продумать не только одежду, но и позу, и эмоцию. Человек может уверенно опираться на капот, сидеть за рулём, выходить из машины или просто стоять рядом, создавая контраст. Чем живее вы опишете модель, тем более реалистичным получится образ. Не скупитесь на прилагательные, описывающие её внешность и настроение.
Следующий важный критерий – антураж. Где происходит действие? Это может быть залитый неоном ночной мегаполис в стиле киберпанк, пустынное шоссе на закате, живописная горная дорога или даже студийное пространство с циклорамой. Окружение задаёт львиную долю атмосферы. К слову, именно локация часто становится той самой изюминкой, которая выделяет изображение из сотен других. Не стоит забывать и про освещение – оно творит чудеса. «Золотой час», «жёсткий полуденный свет», «драматичное освещение Рембрандта» – эти термины помогут нейросети создать нужный настрой.
Ну и, конечно же, технические параметры. Это уже высший пилотаж, но именно он отличает любителя от профессионала. Указание типа камеры (например, Leica M6), объектива (35mm, 85mm), светочувствительности плёнки (Kodak Portra 400), а также стилистических маркеров вроде «cinematic shot» (кинематографичный кадр) или «ultra-realistic» (ультрареалистичный) позволяет добиться потрясающей детализации. Разумеется, не стоит перебарщивать. Перегруженный деталями промт может сбить ИИ с толку. Главное – найти баланс.
Готовые промты: от классики до киберпанка
Теория – это хорошо, но без практики она мертва. Давайте рассмотрим несколько готовых «рецептов», которые можно использовать как есть или адаптировать под свои задачи.
Начнём с городского шика. Представим себе стильную фотосессию в духе глянцевых журналов. Нам нужна элегантная девушка, современный премиальный автомобиль и атмосфера большого города. Запрос может выглядеть так:
cinematic full-body shot of a beautiful woman in an elegant black dress standing next to a glossy black Porsche 911 on a wet asphalt street of a modern city at night, reflections of neon signs in puddles, atmospheric and moody lighting, shot on a Sony a7 III with an 85mm f/1.4 lens, hyper-detailed, 8k --ar 16:9(Кинематографичный кадр в полный рост красивой женщины в элегантном чёрном платье, стоящей рядом с глянцевым чёрным Porsche 911 на мокрой асфальтовой улице современного ночного города, отражения неоновых вывесок в лужах, атмосферное и капризное освещение, снято на Sony a7 III с объективом 85mm f/1.4, гипердетализация, 8k, соотношение сторон 16:9). Здесь мы задали всё: от позы и одежды до конкретной модели камеры.
А что насчёт ретро? Винтажный стиль всегда в моде. Создадим тёплую, ламповую атмосферу старой плёночной фотографии.
Vintage photo of a young couple laughing inside a classic red convertible Cadillac Eldorado Biarritz from 1959, driving along a coastal road in California during sunset, warm golden hour light, shot on Kodak Portra 400 film, slight grain, authentic 1960s vibe, realistic, detailed faces --ar 3:2(Винтажное фото молодой пары, смеющейся в классическом красном кабриолете Cadillac Eldorado Biarritz 1959 года, едущей по прибрежной дороге в Калифорнии во время заката, тёплый свет золотого часа, снято на плёнку Kodak Portra 400, лёгкая зернистость, аутентичная атмосфера 1960-х, реалистичные, детализированные лица, соотношение сторон 3:2). Обратите внимание, как указание на плёнку Kodak Portra мгновенно задаёт нужную цветовую палитру.
Для любителей скорости и динамики подойдёт другой сценарий. Здесь солирует не модель, а сама машина в движении.
Action panning shot of a futuristic silver Lamborghini Revuelto racing on a track at high speed, motion blur on the background, sharp focus on the car, aggressive and dynamic angle, dramatic lighting, rain droplets on the car body, hyper-realistic CGI, octane render, trending on Artstation --ar 16:9(Динамичный кадр с проводкой футуристического серебристого Lamborghini Revuelto, мчащегося по треку на высокой скорости, фон в размытии движения, чёткий фокус на машине, агрессивный и динамичный ракурс, драматичное освещение, капли дождя на кузове, гиперреалистичная компьютерная графика, рендер Octane, в трендах на Artstation, соотношение сторон 16:9). Тут мы уже используем профессиональные термины из мира 3D-графики, чтобы добиться максимальной эффектности.
Как избежать типичных ошибок?
О подводных камнях тоже не стоит забывать. Самая распространённая ошибка начинающих – это излишняя лаконичность и абстрактность. Запрос «девушка и машина» может выдать что угодно. Второй промах – противоречивые команды. Не стоит в одном промте просить «фотореализм» и «стиль Ван Гога». Алгоритм просто не поймёт, чего вы от него хотите, и результат будет, мягко говоря, неоднозначным.
Отдельно стоит упомянуть так называемые «негативные промты». Это команда, которая говорит нейросети, чего на изображении быть НЕ должно. Особенно это актуально при генерации людей. Все мы видели эти мемы про шестипалых моделей или людей с тремя ногами. Чтобы избежать таких артефактов, в конец запроса добавляют параметр --no (в Midjourney) и перечисляют нежелательные элементы. Например: --no extra limbs, deformed hands, ugly, disfigured (без лишних конечностей, деформированных рук, уродливого, обезображенного). Это своего рода спасательный круг.
Главное – не бояться экспериментов. Искусственный интеллект – это довольно мощный, но всё же инструмент в ваших руках. Меняйте слова местами, пробуйте разные стили, добавляйте неожиданные детали. Иногда самая безумная идея приводит к рождению настоящего шедевра. Удачи в творческих поисках, и пусть ваши цифровые фотосессии приковывают взгляды!