Промт для нейросети для создания изображения (с примерами готовых промтов)

В сети представлено множество удивительных изображений, созданных искусственным интеллектом, от фотореалистичных портретов до фантастических пейзажей, от которых захватывает дух. Многие обыватели, вдохновившись этими шедеврами, тоже грезят о том, чтобы творить визуальные чудеса буквально в пару кликов. Они запускают нейросеть, вписывают в заветное поле пару слов и… получают результат, который вызывает скорее недоумение, чем восторг. Зрелище, прямо скажем, довольно удручающее. Но чтобы не разочаровываться и научиться получать от ИИ именно то, что вы задумали, нужно освоить искусство составления правильных запросов.

С чего начинается «общение» с нейросетью?

Основа основ. Всё начинается с промта. Промт (от английского prompt – «побуждение», «команда») — это, по сути, ваше техническое задание для искусственного интеллекта. Это текстовое описание того, что вы хотите увидеть на сгенерированном изображении. И вот здесь кроется первый и главный подводный камень. В представлении многих, достаточно просто написать «красивая девушка» или «закат на море», чтобы нейросеть тут же выдала впечатляющий результат. На самом деле, такие короткие и абстрактные команды почти всегда ведут к провалу. Ведь понятие красоты или хорошего пейзажа у каждого своё, а машина лишена этого субъективного восприятия. Поэтому промт должен быть не просто набором слов, а подробной, структурированной инструкцией.

Задача не из лёгких. Нужно разложить свою идею по полочкам, чтобы алгоритм понял её максимально точно. Чем детальнее и конкретнее будет ваш запрос, тем выше шанс, что итоговая картинка будет соответствовать вашему внутреннему видению. С этим искусством дело обстоит так же, как и с общением с человеком: чем яснее вы излагаете мысль, тем лучше вас понимают. Стоит воспринимать нейросеть не как волшебную палочку, а как очень исполнительного, но абсолютно лишённого фантазии художника. Он нарисует ровно то, что вы ему скажете, и ни деталью больше.

Структура идеального промта: от общего к частному

Чтобы составить добротный запрос, не стоит вываливать на нейросеть поток сознания. Лучше придерживаться определённой логики, двигаясь от общего к частному. Начинать всегда стоит с главного героя вашей будущей картины. Это может быть человек, животное, предмет или даже абстрактная форма. Опишите основной объект максимально чётко.

Далее следует детализация этого объекта. Если это человек, то во что он одет, какая у него причёска, какие эмоции на лице? Если это здание, то из какого материала оно построено, в каком оно состоянии – новое или ветхое? Здесь же можно указать и окружение, фон, на котором находится ваш главный объект. Лес ли это, городская улица или интерьер комнаты? Все эти нюансы вдохнут в картинку жизнь. Отдельно стоит упомянуть стилистику, ведь именно она задаёт антураж и настроение. Вы хотите получить фотореалистичное изображение, картину маслом в стиле импрессионистов, рисунок в духе студии Ghibli, 3D-рендер или, может, кадр из фильма в эстетике киберпанка? Не забудьте это указать.

Ну и, конечно же, технические аспекты, которые творят настоящие чудеса. К ним относятся освещение (например, «мягкий утренний свет», «неоновое освещение», «драматический свет от камина»), ракурс («вид сверху», «крупный план», «голландский угол») и уровень детализации. В конце можно добавить и совсем уж технические параметры вроде разрешения («8k», «4k») или указания на конкретный движок для рендера (популярный вариант – «Unreal Engine»).

Как это выглядит на практике?

Давайте разберём пару примеров, чтобы всё стало предельно ясно. Допустим, мы хотим получить изображение рыжего кота. Простой запрос «рыжий кот» даст довольно посредственный и скучный результат. А вот если мы уточним, наш промт может выглядеть так:

Фотография пушистого рыжего мейн-куна, который сладко спит на стопке старинных книг в залитой солнцем библиотеке, мягкий тёплый свет из окна, высокая детализация, кинематографическое освещение.

А что насчёт более сложных сцен? Представим себе тот самый киберпанк-антураж. Вместо «город будущего» стоит попробовать нечто более развёрнутое. Наш запрос может звучать так:

Неоновый дождливый ночной город в стиле киберпанк, вид от первого лица с балкона небоскрёба, внизу проносятся летающие автомобили, отражения на мокром асфальте, фотореализм, кинематографичный ракурс, движок Unreal Engine 5.

Или, к примеру, фэнтезийный пейзаж. Обыватель напишет «замок и дракон», а искушённый пользователь сформулирует иначе. Попробуйте такой изысканный вариант:

Эпичный фэнтезийный пейзаж, одинокий замок на вершине парящей в облаках скалы, огромный водопад, падающий в бездну, дракон, кружащий в небе, в стиле картин Альберта Бирштадта, драматическое освещение, 8k.

Результат, безусловно, будет на порядок выше.

Каких ошибок стоит избегать?

Главный враг хорошего промта – двусмысленность. Не стоит использовать сложные метафоры или абстрактные понятия, которые машина может истолковать неверно. Чем проще и прямее язык, тем лучше. К слову, львиная доля современных нейросетей (Midjourney, Stable Diffusion) лучше всего «понимает» английский язык, поэтому для достижения максимального качества запросы стоит составлять именно на нём. Это не сильно ударит по вашим возможностям, ведь онлайн-переводчики сейчас довольно хороши.

Ещё один важный нюанс — отрицания. Стоит ли их использовать? Да, но не с частицей «не». Большинство моделей плохо обрабатывают запросы вроде «девушка не в красном платье». Вместо этого они, скорее всего, проигнорируют частицу «не» и нарисуют именно красное платье. Для исключения объектов существуют специальные негативные промты (negative prompts), куда и нужно вписывать всё то, чего на изображении быть не должно: уродливые руки, лишние пальцы, мультяшный стиль, размытость и так далее. Это своего рода спасательный круг, который помогает отсечь брак.

Ну и, наконец, не перегружайте запрос. Хотя детали важны, не стоит превращать промт в роман-эпопею на десять тысяч символов. Слишком длинное и запутанное описание может сбить алгоритм с толку, и он начнёт игнорировать некоторые его части. Найдите золотую середину: достаточно деталей для конкретики, но без избыточной «воды».

Главное – не бояться экспериментировать, пробовать разные комбинации и формулировки. Каждый новый запрос – это шаг к созданию вашего личного шедевра. Удачи в этом увлекательном творческом процессе.