Ленты социальных сетей сегодня пестрят удивительными изображениями, которые ещё вчера казались кадрами из фантастических фильмов или работами гениальных цифровых художников. Киберпанк-пейзажи, фотореалистичные портреты несуществующих людей, сказочные миры — всё это творит искусственный интеллект по текстовым запросам. В представлении многих обывателей, достаточно просто попросить нейросеть «нарисовать красиво», и она выдаст шедевр. Однако на практике вместо ожидаемого результата часто получается нечто странное, аморфное и откровенно удручающее. А чтобы не наткнуться на разочарование, стоит сначала разложить по полочкам сам процесс создания запроса.
С чего начинается волшебство?
Задача не из лёгких. Ведь общение с нейросетью — это не диалог с человеком, который способен додумать и понять намёк. Это скорее составление подробного технического задания для чрезвычайно исполнительного, но абсолютно бездушного механизма. Что же такое промт (от англ. prompt — «побуждение», «запрос»)? По сути, это текстовая команда, инструкция, которая описывает желаемое изображение. Чем детальнее и точнее эта инструкция, тем выше вероятность получить на выходе именно то, что вы задумали. Не стоит думать, что короткий запрос — залог успеха. Наоборот, львиная доля впечатляющих картинок, которые вы видите в сети, создана с помощью довольно внушительных, скрупулёзно составленных промтов.
Анатомия идеального промта
Чтобы добиться предсказуемого и качественного результата, запрос стоит строить из нескольких логических блоков. Это не строгое правило, а скорее фундамент, на котором можно возводить любые творческие конструкции. В основе любого удачного запроса лежит чёткая структура. Во-первых, нужно определиться с главным объектом или персонажем. Это может быть кто угодно: «старый волшебник», «космонавт, сидящий на Луне», «красный спортивный автомобиль». Конкретика здесь — ваш лучший друг. Не просто «девушка», а «рыжеволосая девушка с веснушками в очках».
Далее следует описание действия или состояния. Что делает ваш персонаж? Он «читает древнюю книгу», «смотрит на звёзды» или «пьёт кофе». Это добавляет изображению динамики и сюжета. Не менее важен и антураж, то есть окружение и фон. Где происходит действие? «В уютной библиотеке с камином», «на палубе пиратского корабля во время шторма», «на залитой неоном улице ночного Токио». Окружение творит атмосферу. Без него даже самый проработанный персонаж будет выглядеть оторванным от реальности. Ну и, наконец, последний, но самый важный для художественности блок — это стиль и технические детали.
Как заставить нейросеть рисовать в нужном стиле?
Вот здесь-то и начинается настоящее искусство. Стиль — это изюминка, которая превращает простое описание в произведение. Вариантов масса. Можно указать конкретное художественное направление: импрессионизм, сюрреализм, кубизм, стимпанк или киберпанк. Нейросеть прекрасно знает историю искусств. Хотите получить что-то в духе Ван Гога? Так и пишите: in the style of Vincent van Gogh. Мечтаете об атмосфере мультфильмов Хаяо Миядзаки? Добавьте in the style of Studio Ghibli. Это же правило касается и конкретных техник исполнения. Например, можно попросить сделать изображение, выполненное акварелью (watercolor painting), маслом на холсте (oil on canvas), в виде гравюры (engraving), карандашного наброска (pencil sketch) или даже вышивки (embroidery). К слову, смешение стилей часто даёт самые неожиданные и колоритные результаты.
Технические параметры и камера
Задача этого блока — окончательно убедить нейросеть, что вы хотите получить не просто рисунок, а кадр, снятый на определённую аппаратуру при конкретных условиях. Это особенно важно для создания фотореалистичных изображений. Не стоит пренебрегать и параметрами виртуальной камеры. Указание на тип объектива (например, 35mm lens или 85mm portrait lens) и значение диафрагмы (f/1.8, f/2.8) может кардинально изменить глубину резкости и общую композицию кадра, сделав его более профессиональным.
Особый интерес вызывает работа со светом. Это мощнейший инструмент для создания настроения. Простые слова вроде cinematic lighting (кинематографичное освещение) или dramatic lighting (драматичное освещение) уже задают нужный тон. А можно пойти дальше и указать конкретные схемы: volumetric light (объёмный свет, видимые лучи), soft light (мягкий рассеянный свет) или golden hour (золотой час, тёплое предзакатное освещение). Ну и, конечно же, не стоит забывать про соотношение сторон. Большинство нейросетей по умолчанию генерируют квадратные картинки, но с помощью специального параметра (обычно это –ar или –aspect) можно задать любое соотношение, например, –-ar 16:9 для широкоэкранного пейзажа или –-ar 2:3 для вертикального портрета.
Практические примеры: от простого к сложному
Давайте разберём несколько готовых промтов, чтобы разложить всё по полочкам. Допустим, мы хотим получить фотореалистичный портрет. Вместо «портрет рыбака» стоит написать нечто подобное:
photorealistic portrait of an old fisherman with a white beard, thoughtful look, weathered face, wearing a yellow raincoat, against the backdrop of a stormy sea, dramatic cinematic lighting, shot on a 50mm lens, –ar 2:3
Здесь photorealistic portrait задаёт жанр, old fisherman с уточнениями – нашего героя, yellow raincoat – яркий цветовой акцент, stormy sea – антураж, а dramatic cinematic lighting и 50mm lens отвечают за техническую часть.
А вот пример для любителей фэнтези. Вместо «сказочный лес» попробуем так:
epic fantasy landscape, ancient glowing ruins in a dense jungle, giant luminous mushrooms, a small river with a mysterious fog, art style of Studio Ghibli, volumetric light, ultra detailed, –ar 16:9
Добавление стиля Studio Ghibli мгновенно меняет настроение изображения, делая его более добрым и сказочным. Volumetric light создаст те самые волшебные лучи света, пробивающиеся сквозь туман и листву.
Ну и, наконец, киберпанк.
cyberpunk city street at night, neon signs reflected in wet asphalt, a lone figure in a long trench coat walking away from the camera, Blade Runner aesthetic, cinematic, hyperrealistic, 8k, –ar 16:9
В этом запросе ключевую роль играет упоминание Blade Runner aesthetic. Нейросеть прекрасно знает визуальный код этого фильма и использует его для создания нужной атмосферы. Уточнения про мокрый асфальт и отражения неоновых вывесок добавляют детализации и реализма.
Чего стоит избегать?
Есть и свои подводные камни. Во-первых, не стоит быть многословным без нужды. Каждое слово в промте имеет вес, и нагромождение синонимов или противоречивых описаний может сбить нейросеть с толку. Во-вторых, откажитесь от сложных предложений с причастными и деепричастными оборотами. Лучше дробить описание на короткие, чёткие фразы через запятую. Вместо «Нарисуй кота, который сидит на крыше и смотрит на луну» лучше написать a cat sitting on the roof, looking at the moon. Коротко. Ясно. Ну и, конечно же, не забывайте про негативные промты. Если вы категорически не хотите видеть на изображении какой-то объект или цвет, используйте специальный параметр (чаще всего –no), например, –no red (без красного цвета) или –no people (без людей).
В конечном счёте, создание промтов — это не столько наука, сколько искусство, которое требует практики и насмотренности. Анализируйте работы, которые вам нравятся, пытайтесь угадать, по какому запросу они были созданы. Не бойтесь экспериментировать, смешивать несовместимое и нарушать правила. Иногда именно случайная ошибка или неожиданная формулировка приводит к рождению настоящего цифрового шедевра. Удачи в ваших творческих поисках.