В сети представлены тысячи, если не миллионы, изображений, созданных нейросетями, и каждое из них поражает воображение. Глядя на фотореалистичные портреты, фантастические пейзажи и сцены, будто сошедшие с экрана голливудского блокбастера, многие обыватели грезят повторить подобный успех. Кажется, что достаточно ввести пару слов, нажать кнопку – и искусственный интеллект сотворит чудо. Однако первые же попытки часто приводят к разочарованию: вместо величественного дракона на экране появляется нелепая ящерица, а портрет мечты искажается странными артефактами. Удивительно, но корень проблемы кроется не в несовершенстве технологии, а в неумении с ней общаться. А начать стоит с освоения искусства составления правильных промтов.
Что такое промт и почему он так важен?
В представлении многих промт – это простое описание желаемого. «Красная машина на дороге» или «девушка в лесу». С технической точки зрения это верно, но такой подход никогда не даст впечатляющего результата. Добротный промт – это не просьба, а подробное, скрупулёзное техническое задание для нейросети, в котором учтены все мыслимые и немыслимые нюансы будущего изображения. Роль промта в этом процессе многие недооценивают. Ведь именно от точности формулировок зависит, поймёт ли ИИ вашу задумку, сможет ли он уловить настроение, стиль, освещение и те самые мелкие детали, которые отделяют шедевр от проходной картинки. Сложно ли этому научиться? Вовсе нет, но процесс требует щепетильного подхода и понимания базовых постулатов.
Базовые элементы: из чего состоит добротный запрос?
Задача не из лёгких. Чтобы превратить хаотичный набор слов в мощный инструмент, нужно разложить всё по полочкам. Основа любого качественного промта стоит на нескольких китах. Во-первых, это сам объект или главный герой сцены. Его стоит описывать максимально подробно: не просто «мужчина», а «пожилой скандинавский викинг с седой бородой, заплетённой в косы, и шрамом над левым глазом». Чем больше конкретики, тем меньше у нейросети пространства для нежелательных импровизаций. Во-вторых, необходимо задать действие и позу. Наш викинг может «сидеть у костра, задумчиво глядя на пламя» или «стоять на носу драккара во время шторма». Это же правило касается и эмоций.
Далее следует окружение, или антураж. Где именно находится наш персонаж? В тёмном сосновом бору, на фоне заснежённых фьордов или в шумном зале медового пира? Каждый из этих фонов кардинально меняет атмосферу изображения. Не стоит забывать и про второстепенные детали: «рядом с ним лежит боевой топор», «на небе полыхает северное сияние». К слову, именно такие мелочи и вдыхают в картинку жизнь. Ну и, конечно же, нельзя не упомянуть стилистику. Это может быть «фотореализм», «цифровая живопись», «стиль фэнтези-арта» или даже имитация работ конкретного художника. Без этого уточнения нейросеть выберет стиль по умолчанию, который далеко не всегда совпадает с ожиданиями.
Стиль и атмосфера: как задать настроение?
Магия в деталях. Когда с основной структурой всё понятно, наступает время для настоящей творческой работы. Что насчёт освещения? Это может быть «мягкий утренний свет», «драматическое освещение Рембрандта», «холодное неоновое свечение» или «яркий полуденный солнечный свет». Каждый вариант – это новый слой смысла. Отдельно стоит упомянуть параметры камеры, которые творят настоящие чудеса. Указав конкретный объектив (например, 35mm lens, f/1.8), можно контролировать глубину резкости и перспективу, добиваясь кинематографического эффекта размытого фона или, наоборот, кристальной чёткости всего кадра.
Кстати, можно даже указать модель камеры, например, shot on Hasselblad X1D II. Это тонко намекнёт нейросети на желаемое качество, цветопередачу и общую «дороговизну» картинки. Разумеется, это не означает, что ИИ симулирует работу именно этого аппарата, но он будет тяготеть к референсам, снятым на подобную технику. Например, промт photorealistic close-up portrait of a beautiful young woman with freckles, mischievous smile, red curly hair, gentle morning light through a window, shallow depth of field, shot on Canon EOS R5, 85mm f/1.2 lens, cinematic quality даст куда более предсказуемый и профессиональный результат, чем просто «портрет рыжей девушки».
Продвинутые техники и неожиданные приёмы
Когда базовые принципы освоены, можно переходить к более сложным махинациям. Один из самых мощных инструментов – так называемый вес слов. Если вы хотите сделать акцент на каком-то элементе, его можно «усилить». В некоторых нейросетях (например, в Midjourney) для этого используются двоеточия с цифрой, например, a cat in a ::2 hat. Это говорит алгоритму, что шляпа в два раза важнее кота. Впрочем, с этим стоит быть осторожнее, чтобы не получить перекос в изображении.
А вот о чём многие забывают, так это об отрицательных промтах. Это команда, которая указывает, чего на изображении быть НЕ должно. Обычно она вводится через специальный параметр (--no в Midjourney). Это спасательный круг, когда нейросеть упорно генерирует лишние пальцы, уродливые лица на заднем плане, текст или водяные знаки. Простой запрос --no ugly, deformed, text, watermark способен значительно повысить качество и чистоту итоговой картинки. Ещё один важный технический нюанс – соотношение сторон (--ar). По умолчанию львиная доля моделей генерирует квадратные изображения (1:1), но для пейзажа лучше подойдёт формат 16:9, а для портрета – 2:3.
Готовые промты для вдохновения: Киберпанк и Фэнтези
Теория – это хорошо, но без практики она мёртва. Давайте разберём пару готовых, добротных запросов. Представим, что мы хотим окунуться в атмосферу неонового будущего. Наш промт может выглядеть так:
cyberpunk noir, a male detective in a long trench coat stands in a rain-slicked alley of Neo-Kyoto, neon signs for ramen shops reflecting in puddles, steam rising from vents, moody cinematic lighting, anamorphic lens flare, shot on ARRI Alexa, highly detailed, 8k
Здесь есть всё: чёткий жанр, проработанный персонаж, детализированное окружение, указание на свет и даже на тип камеры и объектива для создания киношной картинки.
А теперь перенесёмся в мир эпического фэнтези. Задача: изобразить замок на скале. Промт будет совсем другим: epic fantasy painting, a majestic ancient castle carved into a giant mountain, waterfalls cascading down the sides, a lone dragon circling the highest tower at sunset, dramatic clouds, style of Albert Bierstadt, volumetric lighting, epic scale, matte painting. Изюминка этого запроса – в сочетании стиля конкретного художника (Альберта Бирштадта, мастера эпических пейзажей) с терминами из киноиндустрии (matte painting), что даёт нейросети очень точное направление для творчества.
Эксперименты с промтами – это кладезь для креативного человека. Не стоит бояться комбинировать несовместимые, на первый взгляд, вещи: «космонавт в стиле барокко» или «подводный город в стилистике стимпанка». Иногда самые неожиданные сочетания рождают по-настоящему грандиозные образы. Главное – не опускать руки после первых неудач и методично улучшать свой запрос, добавляя всё новые и новые слои деталей.
Удачи в ваших творческих махинациях, и пусть нейросеть станет вашим послушным инструментом!