Промт для леонардо (с примерами готовых промтов)

В сети, что ни говори, представлено великое множество самых разных инструментов, призванных упростить творческий процесс, сделать его доступнее и, главное, быстрее. Но способен ли искусственный интеллект на подлинное творчество? Многие, конечно, уверяют, что нейросети вот-вот заменят художников и дизайнеров, да и чего уж там – писателей с поэтами тоже. Однако, это распространённое заблуждение, ведь без человека, без его идеи и чётко сформулированного запроса даже самая мощная нейросеть останется лишь набором алгоритмов. Неоспоримо, именно умение правильно общаться с этими «цифровыми помощниками» превращает их в волшебную палочку, способную воплотить самые смелые задумки. А чтобы не ошибиться, стоит раз и навсегда разобраться, как же составлять эти самые запросы – промты, особенно если речь заходит о таком мощном инструменте, как Midjourney или его русский аналог, «Леонардо».

Что такое промт и зачем он нужен?

В представлении многих обывателей промт – это всего лишь пара-тройка слов, брошенных в окошко нейросети, а дальше, мол, она сама всё сделает. Однако, это же правило касается лишь базовых, самых примитивных запросов, которые, будем честны, редко дают по-настоящему впечатляющий результат. А вот оригинальное название – от английского prompt, что дословно переводится как «подсказка» или «побуждение», весьма точно отражает его суть. По сути своей, промт – это некий текстовый запрос, набор инструкций, который мы, люди, подаём алгоритму нейронной сети, чтобы тот сгенерировал изображение, отвечающее нашим требованиям. Чем более скрупулёзно, детально и, главное, чётко прописан этот запрос, тем выше вероятность получить картинку, максимально приближенную к первоначальной задумке. Ведь именно он имеет важнейшее значение для того, чтобы нейросеть поняла, что именно вы от неё хотите.

Какие бывают промты?

С воздухообменом дело обстоит сложнее, но с промтами всё намного, намного проще. Их можно поделить на несколько основных групп, хотя, конечно же, строгих границ здесь нет. Тем более, что зачастую они переплетаются и комбинируются между собой, создавая по-настоящему богатый и сложный запрос. К первой группе относится, разумеется, простой, или короткий промт. Это, как вы догадались, несколько слов, описывающих основной объект или концепцию, например: «кот в шляпе», «пейзаж с горами», «космический корабль». Здесь нейросеть будет додумывать львиную долю деталей, опираясь на свои внутренние «знания» и общие паттерны, что, к слову, может дать неожиданный, но не всегда желаемый результат. Далее следует подробный, или описательный промт. Тут мы уже начинаем раскрывать детали, добавлять прилагательные, уточнять стиль, цвет, освещение. Например: «Пушистый серый кот в старинной зелёной бархатной шляпе, сидящий в кресле у камина, нарисованный в стиле голландской живописи XVII века, мягкий свет». Этот вариант уже серьёзнее, он позволяет довольно точно направить алгоритм в нужное русло. Ну и, наконец, есть продвинутый, или структурированный промт. Это уже целая конструкция, включающая в себя не только описание, но и специальные команды, параметры, веса, отрицательные промты. Он позволяет контролировать практически каждый аспект генерации, ведь именно здесь проявляется всё мастерство промпт-инженера. К слову, стоит отметить, что именно такой подход и даёт наиболее предсказуемые и качественные результаты.

Структура промта для «Леонардо»

Как же выглядит эта «цепочка слов», которая творит чудеса? В сущности, она строится по вполне логичной схеме, которую, кстати, не стоит воспринимать как незыблемый постулат, но как весьма эффективный ориентир. В основе лежит главный объект или субъект. С него, собственно, и начинается повествование. Это может быть человек, животное, предмет, явление – всё, что угодно, что должно оказаться в центре вашей композиции. Следующим важным критерием идёт описание действия или состояния. Что делает этот объект? Спит, бежит, танцует, парит? Или же он просто находится в определённом состоянии – древний, новый, сверкающий? Далее, разумеется, следует окружение или фон. Где всё это происходит? В лесу, в космосе, в городе будущего, на старинной улице? Детали окружения порой задают весь антураж картины. Отдельно стоит упомянуть стиль и жанр. Здесь мы указываем, как именно должно выглядеть изображение: это может быть фотография, картина маслом, акварель, 3D-рендер, аниме, сюрреализм, киберпанк – вариантов, поверьте, великое множество. К тому же, не стоит забывать про освещение и атмосферу. Мягкий закатный свет, яркий полуденный, неоновое сияние, туман, дождь – всё это вносит свою лепту в общую картину, делает её живой, объёмной. Ну и, конечно же, есть качество и детализация. Здесь мы можем попросить нейросеть сделать изображение гиперреалистичным, с высокой детализацией, в разрешении 8K, с чёткой прорисовкой мелких элементов. Иногда указываются и специальные параметры, такие как соотношение сторон, уровень стилизации, или даже «отрицательные промты», которые говорят ИИ, чего точно не должно быть на картинке.

Зачем усложнять? Ведь есть же простые запросы!

Стоит ли гоняться за сложными формулировками, если можно просто написать «котик» и получить результат? На самом деле, нет смысла переплачивать своим временем и нервами, пытаясь «вытянуть» из нейросети что-то осмысленное с помощью примитивных запросов. Дело в том, что «Леонардо», как и другие подобные нейросети, работает на основе огромных объёмов данных, что, конечно, внушительно. Однако, она не обладает человеческим воображением или способностью к интерпретации неясных указаний. Когда вы пишете «котик», она выдаёт «среднестатистического котика», какого видела чаще всего в своих тренировочных выборках. А если вы хотите котика-астронавта в скафандре, парящего над Луной на фоне Земли, нарисованного в стиле мультфильмов Disney, да ещё и с мягким, рассеянным светом, то без подробного промта она просто не поймёт, что от неё требуется. Вся суть в том, что чем более точными, конкретными и детализированными будут ваши инструкции, тем ближе к вашей задумке будет результат. Это же правило касается не только котиков, но и любых других изображений – от сложной архитектуры до абстрактных концепций.

Примеры готовых промтов: от простого к виртуозному

Практика, как известно, – кладезь знаний. Давайте же рассмотрим несколько примеров, чтобы понять, как работает эта система.

Простой, базовый запрос:

medieval castle
(Средневековый замок)

Что получится? Обычный замок, без изысков, вполне предсказуемый.

Расширенный, с деталями и стилем:

a majestic medieval castle, surrounded by a deep moat, drawbridge lowered, flags flying in the wind, dramatic sunrise lighting, intricate stone textures, hyperrealistic, fantasy art style
(Величественный средневековый замок, окружённый глубоким рвом, опущенный подъёмный мост, флаги, развевающиеся на ветру, драматическое освещение восходящего солнца, замысловатые каменные текстуры, гиперреалистичный, фэнтезийный художественный стиль)

Здесь мы уже получаем нечто гораздо более эпичное и проработанное. Замок приобретёт характер, его окружение наполнится жизнью.

Пример с персонажем и конкретными деталями:

a young witch with fiery red hair, holding a glowing magical orb, standing in an ancient moonlit forest, wearing a dark flowing robe, intricate silver jewelry, mystical atmosphere, volumetric light, highly detailed, photorealistic, cinematic shot
(Молодая ведьма с огненно-рыжими волосами, держащая светящуюся магическую сферу, стоящая в древнем лесу, освещённом лунным светом, одетая в тёмную струящуюся мантию, замысловатые серебряные украшения, мистическая атмосфера, объёмный свет, высокодетализированный, фотореалистичный, кинематографический кадр)

Обратите внимание на детали: цвет волос, предмет в руках, обстановка, даже материал одежды и украшений. Чем больше таких «якорей», тем лучше.

Архитектура и настроение:

futuristic skyscraper in a cyberpunk city, neon lights reflecting on wet streets, flying vehicles, rainy atmosphere, high angle shot, detailed architecture, 8k, cinematic, dramatic lighting
(Футуристический небоскрёб в киберпанковом городе, неоновые огни, отражающиеся на мокрых улицах, летающие транспортные средства, дождливая атмосфера, вид сверху, детализированная архитектура, 8k, кинематографичный, драматическое освещение)

Здесь важны не только сам объект, но и элементы окружения, а также ракурс и качество изображения.

Концептуальное изображение:

a lone astronaut gazing at a distant nebula, surreal cosmic landscape, vibrant colors, dreamy, ethereal, wide shot, masterpiece, award winning photography
(Одинокий астронавт, смотрящий на далёкую туманность, сюрреалистичный космический пейзаж, яркие цвета, мечтательный, эфирный, широкий кадр, шедевр, отмеченная наградами фотография)

Даже абстрактные понятия можно описать довольно точно, используя прилагательные, передающие настроение.

Нюансы и «подводные камни»

Казалось бы, всё довольно просто, однако и здесь есть свои «подводные камни», о которых не стоит забывать. Не стоит перегружать промт излишними, дублирующимися деталями. Иногда избыток информации может запутать нейросеть, давая не тот результат, что вы ожидали. Лучше сосредоточиться на ключевых моментах и использовать более ёмкие формулировки. К тому же, не забудьте пробовать разные варианты синонимов, ведь одно и то же понятие может быть интерпретировано ИИ по-разному в зависимости от выбранного слова. Экспериментируйте с порядком слов, иногда смена расположения фразы на несколько позиций вперёд или назад кардинально меняет исход. Отдельно стоит упомянуть отрицательные промты (--no [что-то]), они позволяют исключить из генерации нежелательные элементы, например: --no text, blurry, distorted. Это очень полезный инструмент, который поможет избежать многих ошибок и улучшить качество итогового изображения.

В конечном итоге, освоение искусства промптинга – это непрерывный процесс обучения и экспериментов. Не стоит бояться пробовать что-то новое, ведь именно через ошибки и неожиданные открытия пролегает путь к настоящему мастерству. Удачи вам в творческих начинаниях, пусть каждая сгенерированная картинка порадует глаз и станет отличным решением для ваших проектов, запомнится надолго и раскроет перед вами безграничные возможности нейросетей!