Промт для шаржа

В сети представлено множество красивых реалистичных портретов, сгенерированных нейросетями, но когда дело доходит до преувеличения черт лица без скатывания в откровенное уродство, большинство алгоритмов откровенно пасует. Сделать добротный академический рисунок легко, а вот заставить машину уловить тонкую иронию и не превратить человека в жуткого мутанта — задача со звёздочкой. Ведь здесь требуется скрупулёзный подход к каждому вводимому слову и понимание архитектуры весов. Но чтобы не ошибиться, нужно собрать выверенный текстовый запрос, учитывающий специфику искажения пропорций в конкретной модели.

Ваш личный ИИ-отдел маркетинга, который работает 24/7 📈

Ускорьте создание контента в 10 раз! Этот мульти-ИИ сервис позволяет писать безупречные продающие посты, генерировать уникальные фото для соцсетей, создавать рекламные промо-ролики с нуля и писать для них музыку в пару кликов. Идеальное решение для предпринимателей, маркетологов и SMM-специалистов. Всё в едином удобном интерфейсе — больше не нужно переключаться между десятком вкладок.

Делегируйте рутину искусственному интеллекту и увеличивайте продажи. Начните работу здесь 👉 https://clck.ru/3RNCRL

Стоит ли доверять автоматическим стилям?

Однозначно нет. Задаёшь простую команду, и на выходе получаешь лишь бессмысленную наляпистость. Это связано с тем, что нейросети изначально тяготеют к усреднению человеческих лиц. Искусственный интеллект панически боится асимметрии. Поэтому на слом этих внутренних ограничений уходит львиная доля времени. К слову, ещё буквально пару лет назад добиться внятного гипертрофированного стиля без артефактов было практически невозможно, алгоритмы выдавали мыльное месиво. Однако сейчас ситуация в корне изменилась. Нужно отметить, что залог успеха кроется в правильном подборе усиливающих дескрипторов. А если ещё вспомнить про возможности работы с конкретными персоналиями, то перед нами открываются поистине грандиозные горизонты.

Базовый костяк

Сразу после стартового тега прописываем желаемый уровень искажения формы. Затем нанизываем свойства творительным падежом: лицом, освещённым ярким светом, носом, увеличенным до гротескных размеров, фоном, заваленным тематическим мусором. Это надёжно. Потому что проверено. Временем. Впрочем, не стоит перегружать генерацию лишними деталями (цветом пуговиц или фактурой дальнего плана). Лучший вариант — оставить только ту самую изюминку, которая мгновенно приковывает внимание зрителя. Например, массивный волевой подбородок или крошечные глаза. К тому же, если попытаться впихнуть в одну строку слишком много вводных, машина просто проигнорирует половину слов. Да и самому автору потом будет довольно сложно разобраться во всплывших ошибках.

Стилистика: от классики до гротеска

Французская карикатура девятнадцатого века всегда вызывала особый интерес у знатоков сатиры. Художник Оноре Домье творил настоящие чудеса, когда дело касалось политических шаржей. Его работы увидели свет в тысяча восемьсот тридцатых годах, однако на этом развитие жанра не закончилось. Специфический колоритный стиль мастера до сих пор отлично распознаётся современными генераторами. Добавив в наш текст фразу «in the style of Honoré Daumier», мы мгновенно получаем вычурный, но узнаваемый штрих. Конечно, кому-то такой исконно винтажный подход покажется излишне мрачным, однако результат заслуживает истинного уважения. Тем более, что классическая графическая подача часто работает как спасательный круг, защищая от пластиковой трёхмерной искусственности.

Как избежать монстров?

Задавать ли параметры в лоб? Да, но делать это нужно крайне аккуратно. Первая ошибка обывателя — использование слов вроде «ugly» или «deformed». Такие термины мгновенно бьют по качеству итоговой картинки, превращая лицо в кашу. Вместо этого стоит применять мягкие маркеры. Один из самых популярных видов запроса включает словосочетание «exaggerated features». Далее следует уточнить конкретную деталь через «oversized head» или «tiny body». Отдельно стоит упомянуть фразу «satirical illustration», которая отлично задаёт нужный антураж. Последним в этой связке идёт упоминание освещения. Студийный мягкий свет здесь солирует, деликатно сглаживая слишком резкие переходы на коже.

Современный 3D-рендер

Выглядит впечатляюще. Буквально десятилетие назад рендер подобного внушительного уровня требовал суток машинного времени, но сейчас всё собирается за несколько секунд. Если хочется получить фигурку, напоминающую забавных персонажей Pixar, кошелёк станет легче только на стоимость ежемесячной подписки. Здесь в ход идут совсем другие постулаты. В запрос обязательно вносит лепту фраза «3D caricature render». За ней следует упоминание графического движка Unreal Engine. Ну и, наконец, добавляется тег Octane Render. Разумеется, не обойтись без объёмного контрового освещения. Гладкая глянцевая кожа венчает композицию. Не забудьте проверить проработку текстур одежды, ведь именно они добавляют реализма этому нарочито мультяшному стилю.

Весовые коэффициенты

Сложнее всего удержать портретное сходство при сильной деформации. Дело в том, что при растягивании пропорций моментально теряется узнаваемость исходника. Многим кажется, что достаточно скормить программе фотографию, но на самом деле без точечной настройки ничего путного не выйдет. Обязательно всплывут проблемы с посадкой глаз. Обе стороны медали придётся учитывать при настройке параметра Image Weight (обычно в районе ноль целых шести десятых). И всё же стопроцентного сходства с первого раза добиться довольно сложно. Это тяжёлый, но невероятно эффективный способ контроля. Не стоит гнаться за идеальным совпадением, ведь шарж сам по себе подразумевает искажение реальности.

Вредно ли смешивать стили?

Обязательно ли придерживаться одного художественного направления? Вовсе нет. Настоящий бомонд нейро-арта давно и успешно практикует гибридные форматы. Смешение акварельной небрежности с жёстким контурным рисунком часто даёт совершенно самобытный результат. С одной стороны, можно получить полную визуальную неразбериху, с другой — изысканный шедевр. Главное — угадать с пропорциями. Не перебарщивайте с количеством имён конкретных художников в одной строке. Оптимально использовать два имени, иначе творческая мысль льётся рекой в совершенно непредсказуемое русло. Ложка дёгтя кроется в том, что алгоритм часто путается в приоритетах. Поэтому самому важному стилю всегда стоит задавать повышенный вес через двойное двоеточие.

Сборка рабочего варианта

Разложим по полочкам конкретную конструкцию для генерации. Начинать нужно с чёткого определения объекта, например, «caricature of a grumpy office worker». Затем заставляем персонажа облачиться в мятый костюм. Далее добавляем детали: лицо с гипертрофированным носом, глаза, налитые усталостью, рот, скривлённый в усмешке. Естественно, прописываем стилистические маркеры вроде «funny big head» и «hyper-detailed digital painting». Ну и, конечно же, соотношение сторон. Формат девять к шестнадцати станет отличной базой для вертикального портрета. Зрелище получается немного удручающее, но зато невероятно жизненное. Пыль буквально оседает на виртуальном пиджаке нашего героя.

Настройки для продвинутых сетей

Здесь процесс не сильно ударит по кошельку (поскольку модели открытые), но потребует вдумчивости. Без грамотного негативного промта далеко не уедешь. В блок отрицаний обязательно отправляется слово «realistic». За ним следует «proportional». Ну и, наконец, стоит жёстко отсечь «boring anatomy». А вот в позитивном запросе стоит использовать токены конкретных LoRA-моделей, специально обученных на шаржах. В представлении многих пользователей достаточно написать одно волшебное слово и нажать кнопку. Однако спектр махинаций с ползунками Denoising strength гораздо шире и таит в себе скрытые подводные камни. Безусловно, придётся серьёзно поэкспериментировать со значениями CFG Scale. Этот параметр лучше держать в пределах от семи до девяти. Настоящий кладезь возможностей открывается при подключении ControlNet. Словно неразумное чадо, алгоритм придётся вести за руку, жёстко фиксируя позу и мимику исходной фотографии. Многие эксперты грезят о кнопке «сделать красиво», однако ручная настройка по-прежнему остаётся единственным рабочим вариантом. Постоянно натыкаешься на неоднозначный результат, пока не подберёшь идеальный баланс весов. Даже качественный бюджетный сетап ПК позволяет окунуться в эти эксперименты с головой. И хотя это серьёзное вложение времени, результат того определённо стоит. Ведь персонаж на экране буквально стоит на ногах, поражая своей детализацией.

Не скупитесь на смелые эксперименты со словами и абсурдные сочетания стилей. Порой самая нелепая комбинация тегов рождает невероятно смешной образ, который заставит улыбнуться самого сурового критика. Удачи в генерации самых безумных портретов, пусть каждый новый результат неизменно радует глаз своей остроумной дерзостью!