Промт для мультяшного персонажа (с примерами готовых промтов)

В сети представлено множество нейросетей для генерации изображений, и каждая из них, кажется, открывает безграничные возможности для творчества. Многие пользователи, грезя о создании своего уникального мультяшного героя, с энтузиазмом вводят первые запросы и… натыкаются на стену разочарования. Вместо харизматичного персонажа с изюминкой на экране появляется нечто усреднённое, безликое и порой даже пугающее. Это похоже на попытку объяснить свою гениальную идею иностранцу, не зная его языка. Но чтобы нейросеть вас поняла и выдала не очередного безликого клона, а действительно запоминающегося героя, нужно скрупулёзно подойти к составлению «технического задания». А начать стоит с основ промт-инжиниринга.

Как нейросеть понимает мультяшный стиль?

Задача не из лёгких. В представлении многих обывателей искусственный интеллект – это некий цифровой художник, который «понимает» задачу. На самом деле всё несколько прозаичнее. Нейросеть не мыслит категориями «красиво» или «смешно». Она оперирует гигантскими базами данных, в которых миллионы изображений соотнесены с текстовыми описаниями. Когда вы пишете «милый котёнок», она анализирует тысячи картинок, помеченных этим тегом, и генерирует усреднённый образ. Вся суть в том, что для получения самобытного результата нужно дать ей как можно больше конкретики, которая сузит поле для поиска и направит её «фантазию» в нужное русло. Ведь именно детали отличают шедевр от ширпотреба.

Не стоит думать, что достаточно одного слова «мультяшный». Это слишком общее понятие. Что именно вы имеете в виду? Стиль студии Pixar с его объёмными и эмоциональными моделями? А может, классическую рисованную анимацию Disney времён «Белоснежки»? Или же вас тяготеет к ламповому и душевному стилю японской студии Ghibli? Каждый из этих вариантов требует своего набора ключевых слов. Поэтому первый шаг к успеху — определиться со стилистическим направлением. Это же правило касается и уточнения самого персонажа. Не просто «девочка», а «маленькая девочка с веснушками и двумя рыжими косичками». Не просто «робот», а «старый, покрытый ржавчиной робот с одним светящимся глазом». Чем точнее описание, тем меньше у нейросети шансов на самодеятельность.

Основа промта: Структура и детали

Итак, с чего начинается составление добротного запроса? С определения ключевых блоков, из которых он будет состоять. Во-первых, это сам объект – наш будущий персонаж. Нужно максимально подробно описать его внешность, от цвета глаз и волос до характерных черт вроде шрама на щеке или забавной шляпы. Не скупитесь на прилагательные, они творят чудеса. Сравните: «мужчина» и «усталый старый волшебник в потрёпанной остроконечной шляпе с длинной седой бородой». Чувствуете разницу?

Далее следует самый важный нюанс, о котором мы уже говорили, – стилистика. Здесь можно и нужно указывать названия конкретных студий (Pixar style, Ghibli studio style), имена известных режиссёров или художников (in the style of Tim Burton), а также общие художественные направления (anime, cartoon, 3D render). К слову, довольно часто отличные результаты даёт смешение стилей, но это уже высший пилотаж. Для начала стоит сосредоточиться на чём-то одном. Отдельно стоит упомянуть детали, которые и вдыхают в картинку жизнь: эмоции, одежда и аксессуары. Пропишите, что персонаж делает: улыбается, грустит, удивлённо смотрит. Это напрямую влияет на его позу и мимику.

Ну и, конечно же, не стоит забывать про антураж и композицию. Персонаж, висящий в белой пустоте, выглядит скучно. Поместите его в подходящее окружение: «в волшебном лесу», «на улице футуристического города», «в уютной библиотеке». Кроме того, можно задать тип кадра. Например, «close-up portrait» (портрет крупным планом) сфокусирует всё внимание на лице и эмоциях героя, а «full-body shot» (кадр в полный рост) позволит показать его костюм и позу целиком. Все эти махинации с настройками превращают бездушный запрос в подробное техническое задание для цифрового художника.

Стоит ли бояться сложных команд?

Магия в деталях. Когда базовые промты освоены, можно переходить к более продвинутым техникам. Сложно ли это? Поначалу может показаться, что да, но результат того стоит. Речь идёт о так называемых «весах» и негативных промтах. Веса позволяют усилить или ослабить значимость определённого слова в запросе. Например, в Midjourney это делается с помощью двоеточия и цифры (например, cat::1.5). Это говорит нейросети, что слово «cat» в полтора раза важнее остальных. Использование скобок (в Stable Diffusion) для усиления ((word)) или ослабления ([word]) тоже довольно популярный приём.

А вот негативные промты – это настоящий спасательный круг. Это специальное поле, куда вы вписываете всё то, чего на изображении быть НЕ должно. Надоели лишние пальцы на руках или кривые глаза? Смело добавляйте в негативный промт: ugly, deformed, extra limbs, extra fingers, poorly drawn hands, mutation. Хотите избежать определённого цвета или объекта? Туда же его. Это мощнейший инструмент для отсечения брака и повышения качества итоговой картинки. Безусловно, нащупать идеальный баланс между основным и негативным промтом – задача, требующая практики. Но именно она отделяет любителя от настоящего мастера.

Готовые примеры: Разбор полётов

Давайте, наконец, разложим по полочкам несколько конкретных примеров, чтобы теория стала нагляднее. Начнём с чего-то доброго и знакомого, вдохновлённого работами студии Pixar.

Промт: Pixar style 3D render of a cute, fluffy red panda wearing a small backpack, looking curious, standing in a sunny forest, cinematic lighting, detailed fur, high resolution.

Что мы здесь видим? Во-первых, чёткое указание на стиль – Pixar style 3D render. Во-вторых, подробное описание героя – cute, fluffy red panda, да ещё и wearing a small backpack (в рюкзачке). В-третьих, задана эмоция и поза – looking curious, standing. Ну и, наконец, проработан антураж и технические детали: in a sunny forest, cinematic lighting, detailed fur, high resolution. Это комплексный и добротный запрос, который даст предсказуемо хороший результат.

А теперь окунёмся в атмосферу японской анимации. Представим, что мы хотим создать персонажа в духе Хаяо Миядзаки.

Промт: A young girl with short brown hair and big wondering eyes, wearing a simple blue dress, holding a magical glowing flower, Studio Ghibli anime style, by Hayao Miyazaki, soft watercolor palette, peaceful atmosphere, cinematic.

Здесь изюминка в точном попадании в стилистику. Упоминание Studio Ghibli и Hayao Miyazaki – это прямой приказ для нейросети обратиться к её «знаниям» о работах этого мастера. Дополняет образ soft watercolor palette (мягкая акварельная палитра) и peaceful atmosphere (мирная атмосфера) – исконно присущие черты стилю студии. В итоге мы получаем не просто аниме-девочку, а персонажа с вполне конкретным настроением и колоритом.

Ну и напоследок, для любителей чего-то более необычного – ретро-анимация.

Промт: 1930s rubber hose animation style character, a cheerful whistling black cat with big pie-cut eyes and white gloves, dancing on a city street, black and white, vintage cartoon, grainy texture.

В этом промте солирует запрос 1930s rubber hose animation style. Это стиль самой ранней анимации с «резиновыми» конечностями без суставов. Такие детали, как pie-cut eyes (глаза-тортики) и white gloves (белые перчатки), моментально отсылают нас к первым мультфильмам про кота Феликса или Микки Мауса. А уточнения black and white и grainy texture (зернистая текстура) окончательно формируют винтажный антураж.

Главное – не бояться экспериментов, пробовать разные комбинации, смешивать стили и добавлять в каждый запрос щепотку собственной фантазии. Перевоплощение завершено. Удачи в создании вашего следующего мультяшного шедевра.