Многие из нас втайне грезят о том, чтобы создавать поражающие воображение картины, не будучи при этом профессиональными художниками. Буквально десятилетие назад это казалось фантастикой, но сейчас, с расцветом нейросетей, генерирующих изображения, эта мечта стала реальностью для миллионов. Достаточно лишь ввести текстовый запрос, и искусственный интеллект воплотит его в визуальный образ. Однако именно на этом этапе обывателя часто ждут первые разочарования: вместо эпического рыцаря получается кривоватый персонаж с пятью пальцами на одной руке и тремя на другой, а живописный пейзаж больше походит на размытое цветное пятно. Но чтобы нейросеть поняла вас с полуслова и выдала шедевр, а не невнятную картинку, нужно освоить язык общения с ней. А начинается этот язык с промта.
Что такое промт и почему он так важен?
Промт – это, по сути, ваше техническое задание для нейросети, текстовое описание того, что вы хотите увидеть на финальном изображении. Казалось бы, что тут сложного? Просто напиши, что хочешь увидеть. Однако на практике всё довольно неоднозначно. Искусственный интеллект, несмотря на всю его мощь, не обладает человеческим воображением и не умеет читать мысли. Он воспринимает ваш запрос буквально, анализируя каждое слово и пытаясь скомпоновать результат на основе гигантской базы данных, на которой его обучали. Именно от качества промта зависит львиная доля успеха. Плохо сформулированный запрос – это лотерея с мизерным шансом на выигрыш. А вот хороший, скрупулёзно составленный промт – это уже практически гарантия получения впечатляющего и, что главное, предсказуемого результата. Поэтому не стоит пренебрегать этим этапом, ведь именно в нём кроются все подводные камни и ключи к успеху.
Структура идеального запроса
Задача не из лёгких. Но если разложить её по полочкам, всё становится понятнее. Чтобы составить добротный промт, стоит придерживаться определённой логической структуры, которая поможет нейросети лучше вас понять. Начать стоит всегда с главного объекта или сцены – это ядро вашего запроса. Что или кто должен быть в центре внимания? Человек, животное, здание, фантастическое существо? Максимально конкретизируйте его. Далее следует определиться со стилем изображения. Вы хотите получить фотографию, картину маслом, акварельный рисунок, 3D-рендер или, может быть, пиксель-арт? Это второй важнейший элемент, который задаёт тон всей работе. Следующий важный пласт – детализация окружения, фона и второстепенных элементов. Где происходит действие? Какая погода? Что находится вокруг главного объекта? Эти нюансы добавляют изображению глубины и атмосферности. Ну и, наконец, венчают композицию технические и художественные уточнения, которые касаются освещения, ракурса камеры, цветовой палитры и общей детализации.
Детализация: Дьявол в мелочах
В представлении многих новичков достаточно написать «красивая девушка», чтобы получить шедевр. Увы, это так не работает. Красота – понятие субъективное, и нейросеть просто не поймёт, что вы имеете в виду. Поэтому детализация – ваш главный спасательный круг. Вместо «красивая девушка» стоит написать: «портрет молодой девушки с веснушками, длинными рыжими волосами, заплетёнными в косу, и зелёными глазами, она загадочно улыбается». Чувствуете разницу? Каждый новый дескриптор сужает для нейросети поле для импровизации и направляет её в нужное русло. Не бойтесь быть скрупулёзным. Описывайте одежду, эмоции, позы, окружение. Чем больше конкретики, тем точнее будет результат. Например, вместо «космический корабль» попробуйте «массивный грузовой космический корабль в стиле ретрофутуризма (с обилием заклёпок и труб), летящий сквозь поле астероидов». Это же правило касается и фона: «лес» – это слишком общее понятие, а вот «заснежённый сосновый бор в лучах заходящего солнца» – уже полноценный антураж.
Какие стили бывают?
Сложно ли определиться со стилем? Поначалу да, но со временем это входит в привычку. Один из самых популярных запросов у пользователей – фотореализм. Чтобы его достичь, в конце промта часто добавляют такие слова, как «photorealistic», «hyperrealistic», «8K», «sharp focus». Это заставляет нейросеть имитировать снимок, сделанный на профессиональную камеру. Изображение получается чётким, детализированным и правдоподобным. Отдельно стоит упомянуть цифровую живопись («digital painting»). Этот стиль тяготеет к работам современных художников, которые рисуют на графических планшетах. Результат выглядит как сочная, проработанная иллюстрация, часто с видимыми мазками кисти. К слову, можно даже имитировать стиль конкретного известного художника, добавив в запрос конструкцию «in the style of [Имя художника]». Кроме того, огромной популярностью пользуются аниме-стиль, акварельные рисунки, стимпанк, киберпанк и даже имитация средневековых гравюр.
Технические параметры и «магические» слова
Когда основная часть промта готова, наступает время для тонкой настройки. Это настоящий кладезь для перфекционистов. Здесь мы можем управлять светом, камерой и общей атмосферой. Хотите драматизма? Добавьте «cinematic lighting» (кинематографическое освещение). Нужна мягкая и нежная картинка? Используйте «soft, gentle light». Для создания глубины и объёма отлично подходит «volumetric lighting». Ракурс тоже играет огромную роль. «Close-up shot» прикуёт внимание к лицу персонажа, «full-body shot» покажет его в полный рост, а «wide-angle shot» или «epic landscape» позволят захватить грандиозную панораму. Нужно отметить, что существуют и так называемые негативные промты. Это поле, куда вы вписываете всё, чего на изображении быть НЕ должно. Например, «уродливый, размытый, плохие руки, лишние пальцы, мутация, деформация». Это помогает отсечь львиную долю брака и повысить качество генерации.
Готовые примеры промтов
Теория – это хорошо, но без практики она мертва. Давайте разберём несколько готовых примеров, чтобы разложить всё по полочкам. Представим, что нам нужен фантастический пейзаж. Наш запрос мог бы выглядеть так:
Эпичный фэнтезийный пейзаж, затерянный город в джунглях, древние руины, увитые лианами, водопады, туманное утро, кинематографическое освещение, высокая детализация, фотореализм, вид с высоты птичьего полёта.
Здесь есть всё: основной объект (город), окружение (джунгли, водопады), атмосфера (туман, утро) и технические уточнения (свет, детализация, ракурс).
А если мы хотим создать портрет? Задача похожая. Попробуем так:
Портрет старого бородатого волшебника в остроконечной шляпе, добрые морщинистые глаза, длинная седая борода, одет в тёмно-синюю мантию, расшитую звёздами, на фоне библиотеки со старинными книгами, магическое свечение, в стиле цифровой живописи, высокая детализация.
И снова мы видим чёткую структуру, которая ведёт нейросеть за руку.
Ну, а для создания уютной, доброй иллюстрации в детскую комнату подойдёт совершенно другой запрос. Например:
Очаровательный маленький лисёнок спит, свернувшись клубочком в норе под корнями дерева, мягкий тёплый свет, стиль акварельной иллюстрации, пастельные тона, милый и добрый персонаж.
Такой промт сразу задаёт нужное настроение и палитру.
Главное – не бояться экспериментировать, пробовать разные сочетания и формулировки. Каждый неудачный результат – это тоже опыт, который приближает вас к созданию настоящего цифрового шедевра. Удачи в ваших творческих начинаниях.