Промт для фото на карусели (с примерами готовых промтов)

В сети представлено невероятное множество изображений, сгенерированных нейросетями. Фантастические пейзажи, фотореалистичные портреты, концепт-арты — всё это уже стало частью нашего визуального ландшафта. Однако статичная картинка, какой бы впечатляющей она ни была, часто не способна рассказать целую историю. Хочется движения, развития сюжета, последовательности кадров, как в комиксе или раскадровке фильма. Удивительно, но для создания такой серии изображений, объединённых одним стилем и персонажем, не нужны сложные махинации, ведь достаточно освоить всего один приём. А начать стоит с понимания структуры так называемого «карусельного» промта.

Как создать идеальный промт для карусели?

Задача не из лёгких. На первый взгляд. Ведь главная цель – добиться визуальной согласованности между несколькими изображениями. Персонаж не должен внезапно менять цвет волос, а готический замок на фоне превращаться в футуристический небоскрёб. Секрет кроется в разделении запроса на две части: постоянную, или базовую, и переменную. Базовая часть – это своего рода ДНК вашей визуальной истории, которую вы будете копировать из одного промта в другой. Она отвечает за главного героя, окружение, стилистику и общую атмосферу. Переменная же часть, как несложно догадаться, описывает конкретное действие, ракурс или эмоцию в каждом отдельном кадре. Такой подход позволяет нейросети «запомнить» ключевые элементы и воспроизводить их с минимальными искажениями.

Структура промта: Декомпозиция запроса

Чтобы создать добротную, надёжную основу, нужно скрупулёзно продумать каждый её компонент. Во-первых, это главный объект или персонаж. Не скупитесь на детали. Вместо «девушка-эльф» стоит написать «молодая эльфийка с длинными серебряными волосами, заплетёнными в косу, зелёными глазами и маленьким шрамом на левой щеке, одетая в тёмно-зелёный кожаный доспех». Чем больше таких «якорей», тем крепче нейросеть будет держаться за созданный образ. Во-вторых, не менее важна локация. «Лес» – это слишком общее понятие. А вот «древний туманный лес с гигантскими светящимися грибами и мшистыми валунами» задаёт совершенно иной антураж. Ну и, наконец, стилистика. Это та самая изюминка, которая превращает набор картинок в цельное произведение.

Что насчёт стиля?

Выбор стиля — это, пожалуй, самый творческий этап. Именно он определяет, будет ли ваша история похожа на мрачную картину в духе Бром, яркий постер в стиле студии Ghibli или на кадр из фильма Уэса Андерсона. Не стоит стесняться указывать имена конкретных художников, фотографов или режиссёров. К слову, можно использовать и более технические термины. Формулировки вроде «cinematic lighting» (кинематографичный свет), «shot on Kodak Portra 400» (снято на плёнку Kodak Portra 400) или «Unreal Engine render» (рендер на движке Unreal Engine) творят настоящие чудеса. Нужно отметить, что именно жёсткая привязка к стилю зачастую становится тем спасательным кругом, который не даёт генерациям «поплыть» и потерять единообразие. Дело в том, что нейросеть, получив чёткую стилистическую установку, будет придерживаться её во всех последующих генерациях с завидным упорством.

Готовые примеры: От фэнтези до киберпанка

Теория – это хорошо, но без практики она мертва. Давайте разложим по полочкам пару конкретных сценариев. Представим, что мы хотим создать серию картинок о приключениях одинокого следопыта в волшебном лесу. Наша базовая, неизменяемая часть промта будет выглядеть примерно так:

a stoic elven ranger with a silver circlet and a longbow, traversing a misty ancient forest with giant glowing mushrooms, fantasy art, detailed, atmospheric lighting, by Greg Rutkowski --ar 16:9 --v 6.0

Это наша основа. Теперь добавляем вариации для каждого слайда карусели. Для первого кадра дописываем: the ranger is kneeling and examining glowing tracks on the ground. Для второго: the ranger is drawing his bow, aiming at an unseen threat in the shadows. Ну а для третьего можно показать момент затишья: the ranger is resting by a small campfire, looking up at the stars through the thick canopy. Как видите, основа остаётся нетронутой, меняется лишь действие.

А теперь окунёмся в совершенно другой мир. Мир неоновых вывесок, кибернетических имплантов и вечного дождя. Наш герой — женщина-детектив в киберпанк-городе. База будет такой:

a female cyborg detective with a glowing blue optic implant and a long leather trench coat, standing on a rainy street in a neon-lit cyberpunk megalopolis, Blade Runner aesthetic, cinematic shot, high detail --ar 16:9 --v 6.0

Что может происходить в этой истории? Для первого слайда подойдёт ...the detective is looking at a holographic clue floating from her cybernetic hand. Далее сюжет может развиваться так: ...the detective is leaning against a steaming noodle stand, talking covertly to a shady informant. И для финала можно выбрать более эмоциональный кадр, например, крупный план: ...a close-up shot of the detective's face, rain dripping from her hair, reflecting neon signs in her tired eyes. Всё. Три кадра, объединённые одним героем и атмосферой, рассказывают мини-историю.

Подводные камни и частые ошибки

Конечно, не всё так гладко, как хотелось бы. Есть несколько нюансов, о которых стоит помнить, чтобы не наткнуться на разочарование. Самая распространённая ошибка — слишком сильное изменение переменной части. Если в одном кадре вы просите показать героя в полный рост, а в следующем — только его руку, нейросеть может «потерять» персонажа. Старайтесь сохранять масштаб и ракурс более-менее сопоставимыми. Ещё один важный момент, особенно для пользователей Midjourney, — это параметр –seed. Если вы хотите максимальной идентичности персонажа, можно попробовать использовать один и тот же seed (числовой идентификатор генерации) для всей серии. Это не всегда работает идеально, но довольно часто помогает сохранить черты лица и детали одежды. Однако не стоит на него полагаться как на панацею, ведь хорошо прописанная база всё-таки важнее.

Ну и, конечно же, не стоит пренебрегать отрицательными промтами (--no). Если вы заметили, что из раза в раз на картинках всплывает какой-то ненужный элемент, смело добавляйте его в исключения. Например, --no text, watermarks (без текста и водяных знаков) — это уже практически стандарт для многих запросов. Процесс, безусловно, не самый быстрый, но довольно кропотливый и творческий. Он требует щепетильного подхода к деталям и готовности к экспериментам.

Экспериментируйте, пробуйте разные стили, придумывайте своих героев и рассказывайте их истории. Ведь теперь у вас есть инструмент, который позволяет выйти за рамки одного изображения. Удачи в создании ваших собственных визуальных вселенных.