Описание поз для промта (с примерами готовых промтов)

Устав от однообразных изображений, где персонажи стоят как истуканы, многие пользователи нейросетей начинают грезить о динамике, эмоциях и естественности. В сети можно найти миллионы сгенерированных картинок, но львиная доля из них страдает общей проблемой – статичностью. Модели смотрят прямо в камеру, принимая скучные, почти паспортные позы. Это связано с тем, что нейросеть, не получив конкретных указаний, выбирает самый простой и усреднённый вариант из своего обучающего набора. Но чтобы не ошибиться и получить действительно живое, запоминающееся изображение, нужно научиться правильно «режиссировать» сцену. А начать стоит с грамотного описания позы персонажа в промте.

Как задать позу в промте?

Основа основ. Без неё никак. Самый прямой и зачастую эффективный способ – это прямое указание на действие или положение тела. Нейросети вроде Midjourney или Stable Diffusion довольно хорошо понимают простые глаголы и существительные, описывающие позу. Нужно отметить, что чем проще и однозначнее формулировка, тем предсказуемее будет результат. Не стоит сразу же бросаться в сложные махинации с описанием изгиба каждого пальца. Начните с базовых команд, которые зададут общую геометрию фигуры. Это может быть что-то вроде «сидит на стуле» (sitting on a chair), «лежит на траве» (lying on the grass) или «идёт по улице» (walking down the street).

Однако даже здесь есть свои подводные камни. Например, промт «девушка стоит» (a girl is standing) почти гарантированно даст вам тот самый скучный портрет анфас. Почему так происходит? Дело в том, что для нейросети это наиболее вероятная интерпретация запроса. Чтобы этого избежать, стоит добавлять уточняющие детали. К примеру, woman standing and looking away (женщина стоит и смотрит в сторону) уже ломает шаблон фронтального портрета. А запрос man standing with hands in pockets, leaning against a brick wall (мужчина стоит с руками в карманах, прислонившись к кирпичной стене) создаёт целую историю и придаёт сцене расслабленный, непринуждённый антураж.

Динамика в движении

Задача не из лёгких. Заставить статичную картинку «дышать» движением – это уже высший пилотаж. Для этого в промте используются глаголы, подразумевающие активное действие. Бег, прыжки, танцы – всё это можно и нужно описывать. Но есть нюанс: нейросеть может «смазать» движение или сгенерировать неестественное положение конечностей. Это же не живой фотограф, который ловит идеальный кадр. Поэтому здесь важна конкретика.

Вместо простого running (бежит) лучше использовать более развёрнутое описание. Например, sprinter at the starting line, tense muscles, ready to run (спринтер на старте, напряжённые мышцы, готов к бегу). Этот промт передаёт не само движение, а его предвкушение, что часто выглядит даже эффектнее. Если же нужна именно динамика, попробуйте woman dancing flamenco, dress swirling around her, captured in mid-motion (женщина танцует фламенко, платье кружится вокруг неё, запечатлена в движении). Добавление деталей вроде кружащегося платья помогает нейросети лучше понять, какую именно фазу движения вы хотите увидеть. Само собой, результат может быть неоднозначным, но эксперименты здесь – ключ к успеху.

Сложные и сидячие позы

Что насчёт статики? Не всегда ведь персонажи должны бегать и прыгать. Иногда нужна задумчивая, спокойная или даже напряжённая поза. И здесь на помощь приходят более скрупулёзные описания. Сидячие позы, к слову, одни из самых благодарных для генерации. Они позволяют сосредоточить внимание на эмоциях, деталях одежды и окружении. Вместо банального sitting попробуйте конкретизировать.

Например, man sitting in a leather armchair, legs crossed, holding a glass of whiskey (мужчина сидит в кожаном кресле, нога на ногу, держит стакан виски). Такой запрос моментально создаёт образ уверенного, состоятельного человека. А вот girl sitting on a windowsill, hugging her knees, looking at the rain outside (девушка сидит на подоконнике, обняв колени, смотрит на дождь за окном) – это уже совсем другая история, полная меланхолии и уюта. Не стоит забывать и про позы на полу. Запрос woman meditating on the floor, cross-legged, eyes closed (женщина медитирует на полу, скрестив ноги, глаза закрыты) с большой вероятностью даст вам безмятежное и гармоничное изображение. Главное – не перегружать промт противоречивыми деталями.

Взаимодействие с объектами и окружением

Персонаж в вакууме выглядит скучно. Чтобы вдохнуть в картинку жизнь, заставьте его взаимодействовать с миром вокруг. Это же так просто. Вместо того чтобы описывать позу изолированно, впишите её в контекст. Любое действие, связанное с предметом, делает позу более естественной и оправданной. К примеру, не просто «стоит», а «опирается на перила балкона» (leaning on the balcony railing). Не «сидит», а «сидит за столом, листая книгу» (sitting at a table, flipping through a book).

Такие уточнения творят чудеса. Они не только диктуют нейросети положение тела, но и обогащают повествование. Сравните два промта.

Первый: a man in a suit. Второй: a man in a suit adjusting his tie while looking in the mirror (мужчина в костюме поправляет галстук, глядя в зеркало).

Второй вариант мгновенно создаёт целую сцену, полную деталей. Поза становится не самоцелью, а естественным следствием действия. Именно этот подход и отличает добротную, продуманную генерацию от бездушной штамповки.

Эмоциональные и невербальные сигналы

Как передать чувства? Поза – это ведь не только положение рук и ног, это ещё и мощный инструмент для передачи эмоций. Иногда одно лишь описание языка тела может рассказать о персонаже больше, чем длинный промт о его внешности и одежде. Здесь стоит оперировать прилагательными и наречиями, которые задают тон. Например, можно добавить thoughtful pose (задумчивая поза), confident stance (уверенная поза) или dramatic gesture (драматический жест).

К тому же, стоит описывать конкретные невербальные сигналы. Промт woman with arms crossed, tapping her foot impatiently (женщина со скрещёнными на груди руками, нетерпеливо постукивающая ногой) чётко передаёт её состояние. А запрос man shrugging his shoulders with a confused look on his face (мужчина пожимает плечами с растерянным выражением лица) не оставляет сомнений в его эмоциях. Конечно, нейросеть не всегда идеально справляется с такими тонкими материями, но попытка не пытка. Зачастую даже частичное понимание такого запроса даёт куда более интересный результат, чем простое описание физической позы. Удачи в ваших творческих экспериментах.