В сети представлено огромное количество изображений, сгенерированных нейросетями. Кажется, что стоит лишь ввести пару слов, и искусственный интеллект тут же нарисует шедевр. Однако на практике многие пользователи сталкиваются с разочарованием: вместо грациозного кота-балеруна на выходе получается нечто с пятью лапами и странным выражением на морде. Вся суть в том, что нейросеть — это не волшебник, а скрупулёзный исполнитель, который требует предельно точного технического задания. А начать стоит с понимания того, как правильно составить запрос, или, как его принято называть, промт.
Как заставить кота танцевать?
Задача не из лёгких. Чтобы получить желаемый результат, недостаточно просто написать «танцующий кот». Такой запрос слишком общий и оставляет нейросети слишком много пространства для интерпретации, которая вас, скорее всего, не устроит. Качественный результат нейросеть выдаёт только на детальный, продуманный до мелочей запрос. Сложно ли его составить? Поначалу да, но процесс затягивает. Это похоже на работу режиссёра, который прописывает сцену: нужно определить главного героя, его действия, окружение, стиль съёмки и даже настроение. Нужно отметить, что хороший промт обычно состоит из нескольких смысловых блоков, которые вместе создают полную картину. Во-первых, это описание самого объекта (нашего кота). Во-вторых, его действие (танец). В-третьих, антураж и фон. Ну и, наконец, стилистика всего изображения.
Главный герой: порода, окрас и эмоции
С чего начинается выбор? С определения того, кто именно будет солировать на нашей цифровой сцене. Не стоит ограничиваться общим словом «кот». Конкретика творит чудеса. Стоит указать породу: возможно, это будет пушистый добротный сибирский кот, изящный сиамский или забавный сфинкс. У каждой породы свои характерные черты, которые нейросеть постарается воспроизвести. Далее следует окрас. Одно дело «рыжий кот», и совсем другое – «пушистый имбирный кот с белыми “носочками” и зелёными глазами». Чем больше деталей вы добавите, тем более живым и колоритным получится персонаж.
Кстати, не стоит забывать и об эмоциях. Что должен выражать наш танцор? Радость, сосредоточенность, а может, даже лёгкую меланхолию? Слова вроде «счастливый», «восторженный», «задумчивый» или «слегка нахмуренный» помогут нейросети передать нужное настроение. К тому же, можно добавить описание шерсти: «гладкошёрстный», «длинношёрстный и пушистый», «с блестящей, лоснящейся шерстью». Всё это вносит свою лепту в итоговый образ, делая его объёмным и убедительным. Ведь именно такие нюансы и отличают проходное изображение от настоящего маленького шедевра.
Какой танец выбрать?
Теперь перейдём к самому интересному – движению. Слово «танцует» слишком абстрактно. Какой именно танец исполняет наш усатый артист? Здесь открывается настоящий простор для фантазии. Один из самых популярных вариантов – балет. В этом случае в промте стоит использовать специфическую лексику: «элегантный арабеск», «грациозный прыжок», «в балетной пачке и пуантах». Нейросеть довольно хорошо распознаёт эти термины и постарается изобразить кота в соответствующей позе.
А если хочется чего-то более динамичного? Пожалуйста. Можно заставить кота танцевать хип-хоп, брейк-данс или даже танго. Для хип-хопа подойдут описания вроде «в энергичной позе», «делает движение робота», «в прыжке». Для танго же понадобятся слова, передающие страсть и драматизм: «в страстном танго», «с розой в зубах», «драматическая поза». Само собой, можно выбрать и диско-стиль, отправив кота на сияющий танцпол под зеркальным шаром. Главное – чётко сформулировать, какого рода движение вы хотите увидеть. Это же правило касается и одежды. Если танец предполагает костюм – балетную пачку, смокинг или широкие штаны – не забудьте это указать.
Стилизация и антураж
Изображение – это не только персонаж и его действие, но и общая атмосфера. Сначала стоит определиться с окружением. Где танцует наш кот? На профессиональной театральной сцене с бархатным занавесом и светом софитов? А может, на залитой неоном улице ночного города? Или вовсе в уютной гостиной у камина? Каждый из этих вариантов создаст совершенно разное настроение. Описание фона – важнейший элемент, который нельзя игнорировать.
Следующий важный критерий – стилистика самого изображения. Вы хотите получить фотореалистичную картинку, которая будет неотличима от настоящей фотографии? Тогда используйте в промте маркеры вроде «photorealistic», «hyperdetailed», «8k». С другой стороны, можно пойти по пути художественной стилизации. Например, попросить нейросеть нарисовать танцующего кота в стиле картин Ван Гога («in the style of Van Gogh»), в виде акварельного рисунка («watercolor painting») или даже в эстетике киберпанка («cyberpunk style»). К слову, именно стилизация часто становится той самой изюминкой, которая делает изображение по-настоящему запоминающимся. Не стоит бояться экспериментов. Иногда самые неожиданные сочетания дают наиболее впечатляющий результат.
Так как же выглядит хороший промт?
Давайте, наконец, разложим по полочкам и посмотрим на конкретные примеры, чтобы теория стала понятнее. Эти конструкции – не догма, а лишь отправная точка для ваших собственных творческих махинаций.
Предположим, мы хотим получить изысканный образ кота-балеруна. Промт может выглядеть так: «A photorealistic ginger cat with green eyes in an elegant ballet arabesque pose on a dark theater stage. The cat is wearing a small white tutu. Dramatic lighting, spotlights, hyperdetailed, sharp focus, cinematic shot». Здесь мы указали всё: фотореалистичный стиль, окрас и цвет глаз кота, конкретную балетную позу, одежду, антураж (тёмная сцена) и даже характер освещения (драматичное, софиты). Такой скрупулёзный подход с львиной долей вероятности даст отличный результат.
А вот пример для любителей уличной культуры. «A cool Siamese cat doing a breakdance freeze on a city street at night. The cat is wearing an oversized hoodie and a small baseball cap. Background of graffiti-covered walls and neon lights. Action shot, dynamic motion, vibrant colors, cartoon style». В этом запросе мы сместили акцент на динамику и мультяшную стилизацию. Указана порода кота, конкретное движение из брейк-данса, соответствующая одежда и очень колоритный фон с граффити и неоном. Результат должен получиться ярким и дерзким.
Ну и, конечно же, куда без диско. «A fluffy Persian cat in a shiny silver jumpsuit is dancing disco under a mirror ball. Colorful flashing lights on the dance floor, funky pose, joyful expression. 1970s aesthetic, retro style, film photography look». Здесь мы погружаемся в атмосферу 70-х. Есть порода (пушистый перс), характерный костюм, обязательные атрибуты дискотеки (зеркальный шар, мигающие огни) и даже отсылка к стилю плёночной фотографии, что придаст изображению винтажный шарм.
Что может пойти не так?
Даже с самым детальным промтом иногда всплывают подводные камни. Одна из частых ошибок – противоречивые требования. Например, не стоит просить нейросеть нарисовать «грустного кота с радостной улыбкой». Результат будет, мягко говоря, неоднозначным. Также стоит избегать слишком сложных композиций с множеством персонажей, если вы только начинаете. Нейросеть может запутаться, кто и что должен делать. Отдельно стоит упомянуть так называемые «негативные промты». Это перечень того, чего на картинке быть НЕ должно (например, «ugly, deformed, extra limbs, blurry»). Они помогают отсечь распространённые артефакты генерации и получить более чистый результат.
Процесс создания идеального промта – это не столько техническая задача, сколько творчество. Это диалог с машиной, в котором вы учитесь говорить на её языке, чтобы воплотить в жизнь свои самые смелые идеи. Не бойтесь добавлять безумные детали, смешивать стили и пробовать снова и снова, если результат не устроил.
Удачи в ваших творческих экспериментах, и пусть ваши цифровые коты танцуют так, как не снилось ни одному живому.