В сети всё чаще мелькают цифровые аватары, поражающие своей реалистичностью или, наоборот, нарочитой фэнтезийностью. Кажется, будто за каждым таким изображением стоит кропотливая работа художника, часы, проведённые с графическим планшетом. Однако львиная доля этих впечатляющих портретов создана нейросетями всего за пару минут. Искусственный интеллект научился творить настоящие чудеса, послушно воплощая в пикселях самые смелые фантазии пользователя. Но чтобы цифровой двойник не выглядел блёклой копией, а обрёл характер, нужно научиться правильно ставить ему задачу. А для этого стоит скрупулёзно разобраться в искусстве составления промтов.
С чего начинается магия?
В представлении многих обывателей общение с нейросетью — это нечто сродни диалогу с джинном: загадал желание, и оно исполнилось. На самом деле, всё куда прозаичнее и одновременно сложнее. Промт – это не просто просьба, а скорее детальное техническое задание для цифрового художника. Чем точнее и подробнее оно составлено, тем выше вероятность получить результат, который не разочарует. Игнорирование же этого постулата приводит к десяткам неудачных генераций и напрасно потраченному времени. Нужно отметить, что структура добротного запроса держится на нескольких китах. Во-первых, это основа – сам объект изображения, его внешность, поза, эмоции. Во-вторых, не менее важный элемент – стилистика, которая определяет общую атмосферу и визуальный язык картинки. Ну и, наконец, в игру вступают технические параметры, которые отвечают за композицию, детализацию и другие сугубо прикладные нюансы. Разобрать эту махину по частям – вот наша первостепенная задача.
Как описать внешность персонажа?
Задача не из лёгких. Ведь нужно перевести абстрактный образ из головы на формальный язык, понятный машине. С чего начинается выбор? С определения ключевых черт. Не стоит пытаться уместить в одном запросе всё и сразу, это лишь запутает алгоритм. Лучше сосредоточиться на 3-4 доминантных характеристиках. Например, пол, возрастная группа, цвет волос и глаз уже создают довольно прочный фундамент для генерации. Вместо сухого «девушка» лучше написать «молодая женщина, 25 лет». Вместо «рыжие волосы» стоит уточнить – «длинные, волнистые, огненно-рыжие волосы». Детализация творит чудеса.
Отдельно стоит упомянуть эмоции и позу. Персонаж может задумчиво смотреть в сторону, загадочно улыбаться или излучать уверенность, глядя прямо в камеру. Эти детали вдыхают в статичное изображение жизнь, придают ему нарратив. Что насчёт одежды? Здесь всё зависит от эпохи и антуража. Для фэнтезийного воина подойдут «детализированные стальные доспехи с гравировкой», а для учёного из викторианской эпохи – «строгий твидовый костюм-тройка». К слову, вот как может выглядеть фрагмент хорошего промта для описания внешности:
portrait of a thoughtful young man with short dark hair, a light stubble on his chin, wearing a cozy knitted gray sweater, looking out the window
Это уже не просто набор слов, а целая микро-история, которую нейросети будет довольно просто визуализировать.
Стилистика: Ключ к атмосфере
Описать внешность – это лишь полдела. Без указания стиля нейросеть, скорее всего, выдаст нечто усреднённое, лишённое изюминки. Именно стилистика превращает простое изображение в произведение искусства. Выбор здесь поистине грандиозный. Один из самых востребованных подходов – фотореализм. Добавление в промт таких слов, как photorealistic, 8K, sharp focus, detailed skin texture, заставит ИИ стремиться к максимальной схожести с реальной фотографией. Можно даже указать модель камеры или тип объектива (например, shot on a Canon EOS R5, 50mm f/1.8 lens), чтобы добиться аутентичного эффекта боке и зернистости.
Совершенно иные законы диктует фэнтези-арт. Здесь на помощь приходят имена культовых художников этого жанра. Указав в запросе in the style of Greg Rutkowski или art by Frank Frazetta, вы даёте нейросети мощный референс, на который она будет ориентироваться. Результат унаследует характерные мазки, цветовую палитру и динамику, присущие работам этих мастеров. Этот же трюк работает и с другими направлениями. Например, cyberpunk, neon lights, Blade Runner atmosphere мгновенно перенесёт вашего аватара на залитые неоном улицы города будущего. А вот довольно добротный пример комплексного промта, где внешность и стиль работают в тандеме:
cinematic shot of a warrior queen with braided silver hair and tribal paint on her face, standing on a cliff, fantasy, epic, dramatic lighting, in the style of Todd Lockwood
Технические параметры
Ну и, конечно же, нельзя забывать про техническую сторону вопроса. Это те самые команды с дефисами, которые обычно ставят в конце промта. Они кажутся незначительными, но на самом деле сильно влияют на финальный результат. Пожалуй, самый важный из них – это соотношение сторон, которое задаётся командой –ar. Например, –ar 16:9 создаст широкоформатное изображение, идеальное для обоев на рабочий стол. А –ar 2:3 сгенерирует вертикальный портрет, который отлично впишется в ленту социальных сетей.
Далее следует версия движка (актуально для Midjourney), которая указывается командой –v. Например, –v 6.0 активирует самую последнюю и продвинутую версию алгоритма, способную создавать невероятно детализированные и реалистичные образы. Кроме того, есть команда –style raw, которая снижает «творческий вклад» нейросети, заставляя её более строго придерживаться запроса. Это спасательный круг в тех случаях, когда ИИ слишком уж увлекается и добавляет много отсебятины. Собрав всё воедино, мы можем получить внушительный и скрупулёзный промт, который почти гарантированно даст превосходный результат:
close-up portrait of a charismatic old wizard with a long white beard and wise blue eyes, fantasy art, intricate details, magical atmosphere, in the style of Donato Giancola –ar 4:5 –v 6.0 –style raw
Разумеется, путь к идеальному аватару лежит через пробы и ошибки. Не стоит бояться экспериментировать, смешивать стили, добавлять неожиданные детали и наблюдать за тем, как бездушный алгоритм на ваших глазах превращается в соавтора. Ведь каждый новый запрос – это возможность открыть для себя что-то новое. Удачи в создании вашего цифрового альтер эго.