Промт для мультяшного фото

В сети представлено множество сгенерированных артов, из-за чего у многих складывается обманчивое впечатление, будто превратить обычный портрет в шедевр мультипликации проще простого. Буквально пару лет назад жутковатые, искажённые лица нейросети выдавали при малейшем отклонении от базовых настроек, но сейчас невероятную гибкость предлагают современные алгоритмы. И всё же пластиковые, бездушные лица часто видит обыватель, пытающийся скрестить реализм с мультяшностью. Дело в том, что абстрактного желания «сделать красиво» машина не понимает, ей требуются чёткие, почти математические формулировки. Однако спектр объектов не ограничивается одной лишь стилизацией. Но чтобы не ошибиться, нужно скрупулёзно подбирать стилистические триггеры, отсекая лишний визуальный мусор.

Зачем переплачивать за нейросети? Экономьте сотни долларов каждый месяц 💸

Оплачивать Midjourney, премиум-версии ChatGPT, видео- и аудио-генераторы по отдельности — это безумно дорого и неудобно. Этот сервис решает проблему! Получите полный пакет премиум-моделей (более 90 топовых нейросетей) по цене одной доступной подписки. Безлимитные возможности, никаких скрытых платежей и сгорающих токенов при активном тарифе.

Перестаньте платить за 10 разных сайтов. Выбирайте выгоду и творите без ограничений 👉 https://clck.ru/3RNCRL

Как добиться нужной стилизации?

Тон всему портрету задаёт блик на радужке глаза. Магия трансформации реалистичного исходника в стилизованный арт начинается именно с этого мелкого штриха. Сложно ли удержать баланс между портретным сходством и откровенной карикатурой? Довольно сложно, ведь грань здесь удивительно тонка. На помощь цифровым художникам приходят проверенные текстовые конструкции, эмулирующие конкретные движки рендера. Один из самых популярных видов стилизации требует упоминания объёмного света, дополненного проработанными текстурами кожи, подсвеченными мягким контровым лучом. Замечательный рабочий промт на английском языке выглядит так:

3d character design, portrait of a cute girl, Pixar style, Disney style, Unreal Engine 5 render, octane render, soft cinematic lighting, detailed clothing, smiling, highly detailed, 8k resolution, pastel colors

К слову, объём вытягивает именно связка конкретных движков. Стоит отметить, что без указания разрешения (например, 4k или 8k) результат часто тяготеет к плоской, невыразительной картинке.

Европейский комикс: линия и цвет

Выбор настроек очень большой. Начинать работу с плоской графикой стоит с определения толщины контура. Сначала базовые тени считывает алгоритм, затем основные цвета накладывает он же, заливая области сплошным тоном, ну и, наконец, характерные чёрно-белые штрихи прорисовывает встроенный фильтр. Не стоит забывать о добавлении зернистости, иначе слишком стерильной получится картинка. Изысканный колоритный образ легко формируется запросом:

2D flat illustration, portrait of a man, European comic book style, Moebius style, clean ink lines, flat colors, halftone pattern, dramatic shadows, vintage color palette, masterpiece

Разумеется, полутона нейросеть может проигнорировать, если вес этой части запроса окажется минимальным. А вот чтобы избежать наляпистости, лучше отказаться от длинных описаний фона. Ведь львиную долю внимания имеет свойство перетягивать на себя именно он. Тем более, что выразительный персонаж — это наша главная цель.

Вредно ли перегружать запрос деталями?

Многие считают, что чем длиннее текст, тем шедевральнее получится итоговый результат, но на самом деле фокус машина просто теряет. Избыток переменных больно бьёт по бюджету времени, затрачиваемому на генерацию. Ток, возникший при перегрузке фантазии автора, автомат отсекает безжалостно, превращая композицию в хаос. Обязательно ли расписывать каждую пуговицу на рубашке персонажа? Вовсе нет. Добротный лаконичный запрос работает куда стабильнее. Вместо перечисления десятка художников, одного солирующего мастера стоит выбрать для чистоты стиля. Например, такую формулировку стоит использовать для создания векторной графики:

Vector art, cartoon portrait, flat vector illustration, Behance style, vibrant gradients, minimalism, isolated on white background

К тому же, по времени рендера такой подход не сильно ударит. Естественно, некоторые нюансы с тенями обязательно всплывут, но на этапе инпейнта их довольно просто поправить.

Аниме-эстетика: свет и эмоции

Задача не из лёгких. Определённую сноровку требует создание качественного аниме-портрета, лишённого стандартных штампов с непропорционально огромными глазами. Особый интерес у цифровых художников японская анимация вызывала всегда. В девяностых годах каждый кадр художники рисовали вручную, тратя на одну сцену десятки часов, однако сейчас около пятнадцати секунд занимает весь процесс. В правильном указании эпохи и конкретной студии кроется главный секрет. Настоящий кладезь вдохновения — фильмы Макото Синкая. Рабочий вариант выглядит следующим образом:

Anime style portrait, 1990s retro anime, Makoto Shinkai style, breathtaking sky background, lens flare, emotional character, detailed eyes, soft pastel lighting, cel shading, high quality

Безусловно, первую скрипку здесь играет правильный свет. Да и в естественной среде самим персонажам находиться комфортнее, а не в пустом вакууме. Нельзя не упомянуть, что роль спасательного круга здесь играет добавление негативного промта, отсекающего трёхмерность.

Опыт студии Ghibli: природные мотивы

Атмосферу всему кадру задаёт шелест листьев на заднем плане. К детализированным природным ландшафтам, где персонаж гармонично вписан в окружение, тяготеет знаменитая студия Миядзаки. Впрочем, довольно непросто перенести эту самобытную стилистику на фотографию реального человека. Через специфические теги машина эмулирует исконно традиционные техники рисования акварелью. Такой надёжный современный аппарат генерации стоит использовать для получения нужного результата:

Studio Ghibli style, portrait of a young boy in a magical forest, lush green foliage, watercolor background, soft sunlight filtering through trees, anime art, whimsical, highly detailed, 8k

Нужный антураж создают деревья, прорисованные мягкими кистями, залитые тёплым светом (около пяти вечера по визуальным ощущениям). Кстати, баланса требуют обе стороны медали в таком подходе — фон нельзя делать ярче лица героя. И всё же впечатляюще выглядит итоговый результат, заставляя зрителя с головой окунуться в сказку.

Гротеск

Наряд для избранных. Увидеть себя с огромным носом или гипертрофированной улыбкой готов далеко не каждый клиент. С одной стороны, это весело, с другой — щепетильного отношения к пропорциям требует любая карикатура. Параметром веса стоит контролировать уровень абстракции, чтобы в откровенный треш генерация не скатилась. Отличный пример для Midjourney или Stable Diffusion звучит так:

Caricature portrait, exaggerated facial features, funny cartoon style, 3d claymation, Aardman Animations style, plasticine texture, studio lighting, humorous, detailed

Специфический глиняный материал солирует в этом запросе. Вся суть в том, что агрессивность карикатуры имитация пластилина сглаживает, делая образ по-настоящему милым. Ну и, конечно же, на указание студийного освещения, которое подчеркнёт фактуру материала, скупиться не стоит. Выглядит это забавно. Потому что ломает стереотипы. Временем.

Стоит ли экономить на референсах?

Напрямую на результат влияет качество исходника. Оправдана ли загрузка мутных, засвеченных селфи при работе с нейросетью? Совершенно точно нет. Откровенный брак выдаст алгоритм, ограниченный скудными данными, сбитый с толку плохим освещением, перегруженный артефактами сжатия. Дело в том, что крепкий фундамент нужен любой нейросети. К технологии ControlNet лучше прибегнуть, используя фотографию как жёсткий каркас, если стоит задача сохранить стопроцентную узнаваемость лица. Такой запрос стоит применить для стилизации под популярных кукол:

Fashion doll style portrait, Barbiecore, plastic texture, glossy lips, flawless skin, vivid pink background, 3d render, toy photography, macro lens, rim light

Скрупулёзный подход к настройке веса референса (в пределах 0.4–0.6) творит чудеса. Буквально десятилетие назад навыков цифровой живописи требовали махинации с трансформацией фото, но сейчас каждому обывателю стал доступен этот процесс. Однако легче станет кошелёк из-за потраченных впустую кредитов генерации без вдумчивого составления текстового описания, а удручающим так и останется результат.

Стиль киберпанк: неон и металл

Восприятие формы меняют неоновые отсветы на скулах. Серьёзное вложение времени в подбор цветовой палитры — это киберпанк в анимационном формате. Со светом дело обстоит сложнее, так как в источниках излучения алгоритмы часто путаются. Идеальный запрос для футуристичного мультяшного героя выглядит так:

Cyberpunk cartoon portrait, Arcane style, League of Legends art style, glowing neon tattoos, mechanical implants, rim lighting, vibrant cyan and magenta colors, painted 3d style, masterpiece, 8k

Тем самым клеем, который собирает воедино 2D-текстуры и 3D-объём, выступает здесь стиль популярного сериала. В представлении цифрового бомонда киберпанк — это всегда мрак и дождь, но на самом деле гораздо лучше работают в анимации яркие, насыщенные тона. Лишними проводами на заднем плане сцену перегружать не стоит. Ведь визуальный шум создадут именно они. И тогда композиция просто развалится на части.

Как выбрать палитру?

Настроение определяет колористика. Нужно ли доверять выбор цвета абсолютной случайности? Лучше отказаться от этой сомнительной затеи. На комплементарных цветах всегда строится продуманный вычурный концепт. Следующий промт стоит использовать для создания мягкой, книжной иллюстрации:

Childrens book illustration, portrait of a cute kid, watercolor painting style, Beatrix Potter style, pastel color palette, soft diffuse light, cozy atmosphere, highly detailed

К слову, мелкие огрехи генерации лица отлично скрывает акварельная техника, а ведь именно они так часто бросаются в глаза профессионалам. В контрасте кроются главные подводные камни — насыщенность машина любит задирать до предела. Поэтому слова «vibrant, oversaturated, high contrast» стоит добавить в негативный блок. Накал страстей это снизит. А по-настоящему душевным получится итоговый результат. Свою лепту внесёт каждый оттенок. И творческая энергия польётся рекой.

Терпения и множества экспериментов с текстовыми формулировками требует освоение нейросетевой стилизации. К желаемому визуальному эффекту обязательно приведут грамотно подобранные модификаторы, точные названия художественных направлений и умеренная детализация. Пусть каждый сгенерированный арт порадует домочадцев и запомнится надолго своими живыми, сочными красками! Перевоплощение завершено.