В сети представлено множество попыток воссоздать ту самую наивную эстетику вкладышей из жевательной резинки, знакомую целым поколениям. Подобный визуальный стиль — настоящий кладезь ностальгии, способный моментально вызвать тёплые чувства. Буквально десятилетие назад это было роскошью, доступной лишь профессиональным иллюстраторам, но сейчас генеративные сети перевернули игру. Многие считают генерацию мультяшной картинки простым делом, но на самом деле искусственный интеллект отчаянно тяготеет к излишнему реализму или современному объёмному рендеру, напрочь убивая самобытный шарм оригинала. Плохой результат – это не всегда вина самого движка, чаще проблема кроется в небрежно составленном техническом задании. В представлении многих, только обученный творческий бомонд способен выдавать шедевры, однако грамотный подход решает всё. Поэтому перед началом экспериментов желательно тщательно изучить механику составления запроса.
Все топовые нейросети в одной подписке! 🚀
Устали оплачивать десятки сервисов отдельно и постоянно включать VPN? Появилась платформа, которая объединяет более 90 передовых ИИ в одном окне. Пишите тексты с новейшими версиями GPT и Claude, создавайте шедевры в Midjourney и генерируйте видео в Sora и Kling. Тексты, изображения, видео и музыка — всё работает на любых устройствах без «танцев с бубном».
Попробуйте бесплатно прямо сейчас! Переходите по ссылке и получите бонусные токены для старта 👉 https://clck.ru/3RNCRL
Стиль гранж в интерьере генераций: Анатомия кадра
Надписи пузырём, нарочито простые линии контуров, залитые локальным цветом, снабжённые мягкими тенями. Это же классика. Вся суть в том, что британский художник Билл Эспри, чьё имя исконно ассоциируется с цветными версиями комикса (начиная с тысяча девятьсот семьдесят восьмого года), использовал весьма специфическую палитру. Разумеется, нейросети об этом факте не догадываются. Чтобы заставить алгоритм выдать нужный колоритный результат, придётся разложить по полочкам каждую деталь. К слову, львиная доля успеха зависит от правильного указания эпохи и техники рисунка. Специфический атмосферный антураж задают текстовые маркеры вроде «retro 90s comic style», «flat colors» и «ink outlines». Без них картинка быстро превращается в вычурный современный арт. Огромное количество бракованных генераций оседает в корзине именно из-за непонимания работы алгоритма.
Вредно ли перегружать запрос деталями?
Вовсе нет. Однако не стоит перебарщивать со сложными концептуальными описаниями. Ведь искусственный интеллект просто запутается в смыслах. Куда логичнее прописывать физические действия персонажей максимально скрупулёзно. Обыватель часто пишет просто «мальчик и девочка любят друг друга», а затем удивляется наляпистости итога. Дело в том, что машине нужна конкретика. Например, запрос должен звучать примерно так:
«a cute cartoon boy and girl, sharing a large red umbrella under heavy rain, minimalistic background, line art, simple coloring, romantic atmosphere –ar 1:1»
Естественно, пропорции квадратного кадра здесь играют не последнюю роль. К тому же квадрат лучше всего подходит под классический формат вкладыша. Любой графический нюанс имеет значение, особенно когда нужно изобразить, как маленькое чадо тянется к воздушному шарику в руках у родителей.
Какими бывают инструменты для творчества
Выбор движков сейчас внушительный. И всё же солирует на этом поле Midjourney, особенно шестая версия. Конечно, ежемесячная подписка бьёт по бюджету, однако итоговое качество того стоит. С другой стороны находится Stable Diffusion. Этот добротный мощный инструмент позволяет натренировать собственную модель на сканах старых вкладышей, и тогда сходство будет просто феноменальным. Процесс не сложный, но кропотливый. Сначала собирается база из пятидесяти изображений, затем они обрезаются в графическом редакторе, тегируются специальными скриптами, и только потом запускается машинное обучение на локальном сервере. Безусловно, это серьёзное вложение сил и времени. Зато потом генерация нужного сюжета не сильно ударит по кошельку, да и контроль над позами героев возрастёт многократно.
Текстовый пузырь
Сложно ли заставить алгоритм написать знаменитую фразу на русском языке без ошибок? Практически невозможно. Хотя и появились отдельные модели, худо-бедно справляющиеся с кириллицей, ложка дёгтя кроется в их нестабильности. Буквы часто пляшут, а шрифты выглядят откровенно криво. Нет смысла тратить часы на генерацию идеальной надписи внутри самой сети, иначе ваш кошелёк станет легче после десятка неудачных платных попыток. Спасательный круг здесь — старый добрый графический редактор. Лучше отказаться от мучительных попыток и просто добавить в промт уточнение «empty speech bubble at the top» или «white text box at the bottom». Тем более, что вставить изысканный винтажный шрифт поверх чистой плашки довольно просто. Это сэкономит массу нервов и времени.
Ошибки композиции и подводные камни
Сразу с обрезанных макушек героев и непонятных артефактов на заднем плане обычно начинаются проблемы у новичков. Сразу бросается в глаза отсутствие гармонии. Искусственный интеллект часто забывает, что нам нужна полноценная жанровая сценка, а не портрет крупным планом. Нужно отметить, что для избежания таких ситуаций в запрос вносят корректировки ракурса, прописывая «full body shot» или «medium shot». Впрочем, иногда натыкаешься на совершенно грандиозный абсурд, когда у персонажей всплывут лишние пальцы или странные пропорции лиц. Это связано с тем, что стилизация под простой рисунок сбивает с толку математические модели, обученные на фотографиях реальных людей. Кроме того, отрицательные параметры творят чудеса.
Слова вроде «realistic, 3d render, complex shading, detailed background» выступают своеобразным санитарным контролем качества. Базовые постулаты композиции никто не отменял.
Важно следить, чтобы герой твёрдо стоял на ногах, а не парил в воздухе.
Одежда и визуальные атрибуты
Наряд для избранных. Именно так можно назвать попытки заставить героев облачиться во что-то конкретное. Если чётко не указать цвета одежды, они непременно сольются с бледным фоном. Мальчика традиционно одевают в синие мешковатые штаны и жёлтую футболку, а девочку — в платье в горошек. Само собой, оттенки могут варьироваться, но контрастность обязательна. А вот оригинальное название бренда лучше не писать прямо в промте, чтобы избежать проблем с блокировками за нарушение авторских прав на платформе. Кстати, визуальная изюминка таких картинок — полное отсутствие детально прорисованных ступней или кистей рук. Их заменяют мягкие округлые формы. Поэтому стоит добавить фразу «simplified hands, minimalist features». Ну и, конечно же, не забываем про сердечки, парящие в воздухе, которые буквально венчают любую романтическую сцену. Именно этот элемент приковывает внимание зрителя.
Стоит ли использовать референсы?
Определённо стоит. Использование функции загрузки картинок позволяет задать жёсткий композиционный каркас. Берётся любой классический вкладыш, загружается в систему, а алгоритму поручается лишь изменить мелкие детали. Например, усадить влюблённых не на деревянную скамейку, а в салон спортивного автомобиля. Люди часто грезят о создании персонализированных подарков на годовщину отношений. И тут перенос лиц реальных людей в стилистику комикса требует особых махинаций с весами референсов. Значение влияния исходника лучше держать в районе средних показателей, иначе щепетильный алгоритм просто выдаст фотографию с лёгким мультяшным фильтром. Получается весьма неоднозначный результат. Настоящий рай для экспериментов открывается, когда начинаешь смешивать стили. Креатив здесь льётся рекой, позволяя генерировать абсолютно безумные, но милые сюжеты.
Подготовка к отправке
Внесение лепты в итоговое изображение всегда ложится на плечи человека. Когда-то тихое увлечение ретушью сейчас превратилось в необходимый навык постобработки. Выручит банальная цветокоррекция, вытягивающая контраст и насыщенность до уровня старой полиграфии. Зрелище удручающее, когда картинка получается слишком глянцевой и современной. Чтобы с головой окунуться в атмосферу газетной печати тысяча девятьсот девяностых годов, поверх рисунка добавляют цифровой шум и лёгкое смещение цветовых каналов. Это вполне бюджетный вариант придания ретро-стиля. Ну, а тексты, как уже упоминалось, вписываются отдельным слоем. Нужно учитывать обе стороны медали: и грамотную генерацию, и аккуратную финальную сборку. Ну и, наконец, важно подобрать ту самую ёмкую фразу, ради которой всё и затевалось. Главное — угадать с эмоциональным посылом.
Эксперименты с генерацией таких трогательных картинок требуют терпения, но радость от полученного результата перекрывает все технические сложности. Пусть созданные иллюстрации вызовут искреннюю улыбку у вашей второй половинки, а процесс составления идеального запроса станет увлекательным творческим приключением, которое запомнится надолго!