Промт для ии с котом (с примерами готовых промтов)

В сети представлено бессчётное количество изображений кошек. Милые, смешные, грациозные, спящие в немыслимых позах — они давно стали негласной валютой интернета. Буквально десятилетие назад создание качественного, оригинального арта или фото с пушистым питомцем было уделом художников и фотографов. Но сейчас, с расцветом генеративных нейросетей, любой желающий может сотворить свой собственный шедевр. Однако, чтобы на выходе получить не крипового монстра с шестью лапами, а именно того кота, о котором вы грезите, нужно научиться правильно «общаться» с искусственным интеллектом. А начать стоит с освоения искусства составления промтов, или, проще говоря, текстовых запросов.

Основы промт-инжиниринга: Анатомия запроса

Задача не из лёгких. В представлении многих обывателей, достаточно просто написать «кот», чтобы нейросеть выдала прекрасную картинку. Так ли это? Разумеется, нет. Такой запрос даст вам усреднённое, часто скучное и лишённое изюминки изображение. Секрет успеха кроется в детализации. Добротный промт — это своего рода техническое задание для цифрового художника, и у него есть своя структура. Во-первых, это главный объект, в нашем случае – кот. Стоит сразу уточнить его породу, окрас, возраст и даже характер. Во-вторых, необходимо описать действие и окружение. Что ваш кот делает? Спит, охотится, смотрит в окно? Где он находится? На крыше ночного города, в уютной библиотеке или в космическом корабле? Ну и, наконец, третья, но не менее важная часть – стилистика и технические параметры. Именно здесь и начинаются настоящие творческие махинации.

Как получить фотореалистичное изображение?

Допустим, вы хотите создать картинку, которую не отличить от настоящей фотографии. Задача довольно сложная, но выполнимая. Для этого в запросе нужно использовать специфическую лексику, понятную нейросети. Начать нужно с описания самого животного. Не просто «рыжий кот», а «крупный рыжий мейн-кун с пушистым хвостом и кисточками на ушах». Далее добавляем антураж: «лежит на старом кожаном кресле у камина в загородном доме». А вот теперь начинается самое интересное — технические уточнения. Чтобы добиться фотореализма, стоит добавить в промт маркеры, связанные с фототехникой. Например, «снято на камеру Canon EOS 5D Mark IV с объективом 50mm f/1.4». Почему именно так? Дело в том, что нейросеть обучалась на миллионах фотографий с метаданными, и она «знает», как выглядит изображение, сделанное конкретным объективом. Дополнительно можно указать «мягкий тёплый свет от камина», «высокая детализация шерсти», «глубина резкости», «8k», «photorealistic». В итоге полный промт может выглядеть так:

«Фотография крупного рыжего мейн-куна, который спит, свернувшись клубком, на старом кожаном кресле у горящего камина. Мягкий тёплый свет от огня освещает его шерсть. Снято на камеру Canon EOS 5D Mark IV с объективом 50mm f/1.4, кинематографичное освещение, высокая детализация, 8k, уютная атмосфера».

Кот в мире фэнтези и киберпанка

С фотореализмом разобрались, но что если хочется чего-то совершенно фантастического? Искусственный интеллект — это кладезь возможностей для создания артов в любом мыслимом стиле. С одной стороны, можно облачить нашего кота в доспехи и отправить в эпическое путешествие. С другой — превратить его в киборга из неонового будущего. Главное – угадать с ключевыми словами. Для фэнтези-арта отлично подойдут маркеры «epic fantasy art», «magic glow» (магическое свечение), «concept art». Кроме того, можно указать имя известного художника в этом жанре, например, «in the style of Greg Rutkowski» или «in the style of Frank Frazetta». Тогда нейросеть постарается имитировать их самобытную манеру. Пример такого запроса:

«Чёрный кот-маг в остроконечной шляпе сидит на стопке древних книг. В его лапе светится магический шар. Эпическое фэнтези, концепт-арт, детализированная цифровая живопись, драматическое освещение, в стиле художника Todd Lockwood».

А вот для погружения в мир киберпанка потребуется совершенно другой набор слов. Тут на сцену выходят «cyberpunk», «neon lights» (неоновые огни), «holographic» (голографический), «robotic parts» (роботизированные части). Антураж тоже меняется: вместо замков и лесов — дождливые улицы мегаполиса, светящиеся рекламные вывески и летающие автомобили. Чтобы задать тон, можно сослаться на культовые произведения. Добавьте в промт «in the style of Blade Runner» (в стиле фильма «Бегущий по лезвию»), и результат вас приятно удивит. Например:

«Кот-киборг с неоновыми голубыми глазами сидит на крыше небоскрёба. Внизу простирается футуристический город под проливным дождём. Киберпанк, неоновое освещение, голографическая реклама, атмосфера фильма «Бегущий по лезвию», высокая детализация, сине-фиолетовая палитра».

Выглядит впечатляюще, не правда ли?

Что делать, если ИИ вас не понимает?

Иногда, даже при самом скрупулёзном подходе к составлению промта, результат получается, мягко говоря, неоднозначным. Лишние конечности, искажённые пропорции, странная композиция – всё это подводные камни, на которые натыкается каждый новичок. Что делать в такой ситуации? Во-первых, не стоит отчаиваться. Процесс генерации — это всегда немного лотерея. Во-вторых, нужно попробовать упростить запрос. Возможно, вы перегрузили его конфликтующими деталями. Попробуйте убрать часть описаний и сгенерировать изображение заново. В-третьих, на помощь приходит мощный инструмент – негативный промт. Это специальное поле, куда вы вписываете всё то, чего на изображении быть НЕ должно. Туда можно и нужно добавлять такие слова, как «уродливый», «искажённый», «плохая анатомия», «лишние лапы», «мутация», «размытый», «плохое качество». Это своего рода спасательный круг, который помогает отсечь львиную долю неудачных генераций.

Короткие промты: Искусство минимализма

Иногда меньше – лучше. Это же правило касается и промтов. Хотя детальные запросы дают больше контроля, некоторые нейросети, особенно Midjourney, творят чудеса, отталкиваясь от коротких, но ёмких фраз. Вся суть в том, что модель пытается найти глубокие ассоциативные связи между словами. Такой подход требует интуиции и готовности к экспериментам, но результаты могут быть по-настоящему самобытными и художественными. К слову, здесь не нужно стремиться к точности, скорее – к созданию настроения. Короткий промт может состоять всего из нескольких слов. Например:

«Кот-самурай, акварельный рисунок, минимализм».

Или

«Космический кот, туманность, звёздная пыль».

Или даже совсем абстрактное:

«Душа кота, кинематографичный чёрно-белый кадр».

Нейросеть сама додумает детали, опираясь на свой внутренний «опыт». В этом и заключается изюминка такого подхода – вы задаёте лишь вектор, а остальное отдаёте на откуп машине, получая на выходе нечто совершенно неожиданное.

Общение с искусственным интеллектом – это удивительный творческий процесс, который открывает грандиозные горизонты для фантазии. Не стоит бояться экспериментировать, смешивать стили, добавлять безумные детали и нарушать правила. Каждый неудачный результат – это не провал, а лишь шаг на пути к созданию идеального изображения. Теперь, вооружившись этими знаниями, вы сможете превратить любую свою идею в настоящий цифровой шедевр. Удачи в ваших творческих поисках.