В сети ежедневно появляются тысячи удивительных изображений, созданных искусственным интеллектом. Глядя на фотореалистичные портреты, фантастические пейзажи и сюрреалистичные концепт-арты, многие пользователи тоже грезят о том, чтобы творить подобную магию. Однако первые попытки часто приводят к разочарованию: вместо величественного дракона нейросеть выдаёт нелепую ящерицу с шестью лапами, а вместо изысканной леди в викторианском платье – кривоватую фигуру с перекошенным лицом. Проблема кроется не в возможностях ИИ, а в неумении с ним «общаться». А чтобы стать из обывателя настоящим «заклинателем» нейросети, стоит разложить по полочкам искусство составления правильных промтов.
С чего начинается магия?
Задача не из лёгких. Казалось бы, что сложного в том, чтобы описать картинку словами? На самом деле, промт (от англ. prompt – побуждение, подсказка) – это не просто описание, а скорее скрупулёзное техническое задание для очень исполнительного, но абсолютно лишённого фантазии робота. Он не умеет додумывать и читать между строк. Всё, что вы не указали, будет сгенерировано случайным образом. Именно поэтому запрос «кошка» может выдать вам как милого котёнка, так и рисунок в стиле Пикассо или даже мультяшного персонажа. Дело в том, что для нейросети все эти образы одинаково валидны. Поэтому главный постулат успешной генерации – максимальная конкретика.
Структура идеального промта
Чтобы получить предсказуемый и добротный результат, запрос стоит выстраивать по определённой логике. В основе любого удачного промта лежат несколько «китов». Во-первых, это главный объект и его действие. Нужно чётко определить, кто или что находится в центре композиции. Например, «старый волшебник читает книгу». Во-вторых, необходимо добавить уточняющие детали. Какая на нём одежда, какие у него эмоции, какая обложка у книги? Жизнь изображению придают именно детали: «Старый волшебник в фиолетовой мантии, расшитой звёздами, с задумчивым лицом читает массивный фолиант в кожаном переплёте». Далее следует описать окружение или фон – «в тускло освещённой библиотеке с высокими стеллажами». Ну и, конечно же, нельзя не упомянуть стиль, который венчает всю эту конструкцию и задаёт антураж.
Какие бывают стили и как их задавать?
Стилизация – это, пожалуй, самая интересная часть работы с промтом. От неё зависит львиная доля успеха. Что насчёт стиля? Лучший вариант – это тот, который максимально соответствует вашей идее. Если вы хотите получить удивительно реалистичный снимок, стоит использовать термины из мира фотографии. Укажите модель камеры (например, shot on Canon EOS R5), тип объектива (85mm f/1.2 lens), характер освещения (cinematic lighting, soft light), ракурс (close-up portrait, full-body shot) и другие фотографические параметры. Результат творит чудеса, приближая генерацию к работам настоящих мастеров.
С другой стороны, если ваша цель – художественное произведение, то и язык должен быть соответствующим. К слову, нейросети отлично понимают команды вроде «oil painting» (картина маслом), «watercolor sketch» (акварельный набросок) или «pencil drawing» (рисунок карандашом). Кроме того, можно указать конкретное направление в искусстве, такое как «cyberpunk», «steampunk», «fantasy art» или «art nouveau». Настоящей изюминкой станет упоминание имени известного художника. Запрос, дополненный фразой in the style of Ivan Aivazovsky или in the style of Alphonse Mucha, заставит нейросеть имитировать их самобытную манеру. Это же правило касается и цифровых художников, особенно тех, чьи работы в большом количестве представлены на площадках вроде ArtStation.
Примеры готовых промтов
Теория без практики мертва. Давайте посмотрим, как могут выглядеть рабочие и эффективные промты. Это не строгие шаблоны, а скорее ориентиры для ваших собственных махинаций с текстом.
Предположим, мы хотим получить фотореалистичный портрет колоритного персонажа. Наш запрос может выглядеть так:
photorealistic portrait of a charismatic old pirate captain, weathered face with a kind smile and a twinkle in his eye, detailed wrinkles, grey braided beard, wearing a leather tricorn hat and a vintage naval coat, cinematic dramatic lighting, background of a ship's cabin, shot on ARRI Alexa camera with a 85mm lens, ultra detailed, sharp focus
Как видите, здесь есть всё: объект, его эмоции, детали одежды, свет, фон и технические параметры камеры.
А вот пример для создания фэнтезийного пейзажа. Задача – нарисовать нечто грандиозное и сказочное. Промт будет совсем другим:
epic fantasy landscape, a majestic crystal castle on a floating island in the sky, giant glowing waterfalls cascading into the clouds, sunset, vibrant colors, magical atmosphere, intricate details, wide-angle view, digital painting, trending on Artstation, in the style of Greg Rutkowski
В этом запросе акцент смещён на атмосферу, цвет, масштаб и художественный стиль.
Что делать, если результат не устраивает?
Даже самый скрупулёзный промт не всегда даёт идеальный результат с первой попытки. Это нормально. Не стоит отчаиваться. Процесс генерации – это почти всегда итерационный подход. Что-то пошло не так? Попробуйте переформулировать запрос, добавить или убрать детали. Иногда нейросеть «зацикливается» на каком-то элементе. В таких случаях на помощь приходит так называемый негативный промт (обычно задаётся через параметр --no или в специальном поле). Туда вы можете вписать всё, чего на картинке быть не должно: low quality, bad anatomy, extra limbs, blurry, text, watermark. К слову, это настоящий спасательный круг при генерации людей, ведь нейросети до сих пор испытывают трудности с отрисовкой пальцев, и команда --no deformed hands довольно часто выручает.
Кроме того, стоит экспериментировать с «весом» слов. В некоторых моделях (например, в Midjourney) можно указать важность того или иного элемента, добавив после слова конструкцию ::2, где цифра обозначает приоритет. Это довольно мощный инструмент, который позволяет смещать фокус внимания ИИ. Впрочем, это уже нюансы для продвинутого использования. Начать стоит с составления подробных и логичных текстовых заданий. Процесс этот довольно увлекательный и затягивающий. Главное – не бояться экспериментировать, и тогда каждая новая генерация станет маленьким произведением искусства, которое захочется показать всему миру.
Удачи в ваших творческих поисках.