В сети представлено множество руководств по генерации изображений с помощью нейросетей, и кажется, что создать цифровой шедевр может каждый. Однако львиная доля пользователей, особенно на старте, сталкивается с одной и той же проблемой: результат получается плоским, безжизненным, а персонажи – похожими друг на друга как две капли воды. Особенно остро это проявляется при попытке сгенерировать убедительный мужской образ, который часто грешит излишней феминностью или шаблонной брутальностью. Но чтобы не ошибиться и научиться творить действительно впечатляющие арты, нужно разложить по полочкам сам процесс составления запроса, или, как его принято называть, промта.
С чего начинается промт?
Задача не из лёгких. В представлении многих обывателей, промт – это хаотичный набор слов, описывающих желаемое. Отчасти это так, но за этим хаосом скрывается довольно строгая структура. С чего же начинается выбор? С определения главного объекта. Не просто «парень», а конкретизация его типажа. Молодой студент, седовласый мудрец, закалённый в боях воин или изысканный аристократ – каждый из этих образов требует своего набора слов. Стоит сразу задать возраст (young man, middle-aged man, old man), телосложение (athletic body, slender, muscular build) и даже этническую принадлежность, если это имеет значение для вашей задумки. Это тот фундамент, на котором будет строиться весь остальной антураж. Сложно ли это? На первый взгляд – да, но на деле всё подчиняется логике, и освоив её, вы сможете творить чудеса.
Внешность: Глубина и характер
Лицо – зеркало души. Именно оно приковывает к себе основное внимание, и именно с ним нейросети чаще всего допускают ошибки. Поэтому детализация внешности – это ваш спасательный круг. Вместо «красивое лицо» лучше использовать более конкретные описания. Например, «волевой подбородок, высокие скулы, пронзительный взгляд зелёных глаз, короткая щетина». То же самое касается и волос: не просто «тёмные», а «растрёпанные угольно-чёрные волосы до плеч» или «короткая стрижка цвета меди». Одежда – это следующий важный критерий. Нужно отметить, что здесь важны не только фасон, но и материалы. Добротная кожаная куртка, поношенная джинсовая рубашка, строгий твидовый пиджак или футуристичный комбинезон с неоновыми вставками – всё это добавляет образу глубины и рассказывает историю персонажа без слов. Не скупитесь на эпитеты, ведь именно они добавляют изюминку.
Какой стиль выбрать для генерации?
Выбор стилистики огромен. Один из самых востребованных – фотореализм. Для его достижения в промт добавляют такие маркеры, как photorealistic, 8k, ultra detailed, sharp focus. В результате получается изображение, которое практически неотличимо от настоящей фотографии. Это идеальный вариант для создания портретов или реалистичных сцен. Далее по популярности следует фэнтези. Здесь на помощь приходят слова fantasy, epic, concept art, artwork by Greg Rutkowski (или любого другого известного художника в этом жанре). Так можно создать образы эльфов, гномов, рыцарей и магов в колоритном окружении замков и драконов. Отдельно стоит упомянуть киберпанк, который тяготеет к неоновому освещению, имплантам и футуристической архитектуре. Промты в таком стиле обычно содержат cyberpunk, neon lights, futuristic city, technological. Ну и, конечно же, не стоит забывать про аниме, живопись маслом или акварелью – для каждого направления существуют свои уникальные маркеры.
Готовые примеры: Кладезь идей
Чтобы теория не была голой, давайте рассмотрим несколько готовых промтов, которые можно взять за основу. Представьте себе учёного-историка, работающего поздно вечером в своей библиотеке. Он сидит за массивным дубовым столом, заваленным старинными фолиантами. На нём твидовый пиджак с заплатками на локтях, а в глазах, скрытых за круглыми очками, горит огонь познания. Сам промт может выглядеть так:
photorealistic, middle-aged man with graying hair and a thoughtful expression, wearing a tweed jacket, sitting at a large wooden desk in a dimly lit library, surrounded by old books, warm light from a desk lamp, intricate details, 8k
А вот совершенно другой образ – киберпанк-наёмник. Брутальный мужчина с кибернетическим глазом и татуировками, идущий по залитой дождём улице ночного мегаполиса. Вокруг него светятся неоновые вывески, отражаясь в лужах на асфальте. Запрос будет иным:
cinematic shot of a muscular man with a cybernetic eye and intricate tattoos, walking down a rainy street in a futuristic cyberpunk city, neon signs reflecting in puddles, wearing a worn leather jacket, dramatic lighting, style of Blade Runner, ultra detailed
Или, к примеру, образ благородного рыцаря из фэнтези-мира. Он стоит на вершине скалы, глядя на раскинувшуюся внизу долину. Его стальные доспехи, украшенные тонкой гравировкой, сияют в лучах заходящего солнца, а за спиной развевается алый плащ. В этом случае промт может быть таким:
epic fantasy concept art, a handsome knight in ornate full plate armor with intricate engravings, standing on a cliff edge at sunset, red cape flowing in the wind, majestic valley below, style of fantasy illustration, highly detailed, dramatic atmosphere
Ну, а что насчёт чего-то более приземлённого? Обычный парень в уютной кофейне. Он сидит у окна, за которым идёт снег, и держит в руках чашку с горячим кофе. На нём тёплый вязаный свитер. Атмосфера спокойная и немного меланхоличная. Пробуем:
cozy atmospheric photo, a young handsome man with tousled brown hair wearing a knitted sweater, sitting by a window in a cafe, holding a coffee mug, snowing outside, soft natural light, shallow depth of field, candid shot
Как видите, махинации с промтами позволяют добиться совершенно разного настроения.
Что такое негативный промт?
Это ещё один мощный инструмент в вашем арсенале. Негативный промт – это поле, куда вы вписываете всё, чего НЕ хотите видеть на изображении. Дело в том, что у нейросетей есть свои «слабости»: они могут генерировать людей с лишними пальцами, искажёнными чертами лица или нелепыми артефактами. Чтобы избежать этих подводных камней, в негативный промт стоит добавить стандартный набор исключений: deformed, ugly, bad anatomy, extra limbs, poorly drawn hands, poorly drawn face, blurry, watermark, signature. Обязательно ли его использовать? Не всегда, но для получения чистого и качественного результата он довольно часто становится спасательным кругом. К тому же, туда можно вносить и стилистические ограничения, например, cartoon, anime, если вы стремитесь к фотореализму и хотите отсечь любые намёки на рисованный стиль.
Создание идеального образа – процесс не столько технический, сколько творческий. Не стоит бояться экспериментировать, смешивать стили, добавлять неожиданные детали и менять формулировки. Каждый новый промт – это маленькое исследование, которое может привести к совершенно грандиозному результату.
Удачи в ваших творческих экспериментах!