В сети представлено множество галерей, созданных искусственным интеллектом, где женские образы льются рекой: от фэнтезийных принцесс до киберпанк-воительниц. А вот с мужскими персонажами дела обстоят сложнее. Довольно часто нейросети по умолчанию грешат излишней слащавостью или, наоборот, впадают в крайности, рисуя карикатурных брутальных гигантов. В представлении многих обывателей, получить добротный, стильный и характерный мужской портрет – задача почти невыполнимая. Однако на самом деле вся суть в правильной формулировке запроса. Но чтобы не ошибиться и не потратить часы на бесплодные попытки, стоит разложить по полочкам основные принципы и приёмы.
Как составить промт, который поймёт нейросеть?
Задача не из лёгких. Ведь ИИ – это не художник, а сложный алгоритм, который буквально воспринимает каждое слово. С чего начинается работа? С определения четырёх китов, на которых держится любой успешный запрос. Во-первых, это объект – главный герой вашей будущей картины. Во-вторых, его окружение и поза, создающие антураж. В-третьих, стилистика, которая задаёт общее настроение. Ну и, наконец, технические детали – свет, камера, цветовая палитра. Не стоит вываливать на нейросеть всё подряд. Лучше действовать последовательно, выстраивая образ кирпичик за кирпичиком. И не забывайте про английский язык: львиная доля моделей ИИ обучалась именно на нём, поэтому англоязычные промты почти всегда дают более точный и детализированный результат.
Начать нужно с максимально конкретного описания персонажа. Вместо расплывчатого «мужчина» лучше написать «пожилой скандинавский рыбак с седой бородой и глубокими морщинами». Чувствуете разницу? Нейросеть её тоже почувствует. Добавьте детали одежды, эмоцию на лице, может быть, какой-то предмет в руках. Это же правило касается и фона. Не «в лесу», а «в туманном сосновом бору на рассвете». Чем больше конкретики, тем меньше у ИИ пространства для махинаций и самодеятельности. К слову, именно на этом этапе отсеивается большинство неудачных генераций, которые всплывут позже.
Кинематографичный портрет: игра со светом и тенью
Один из самых востребованных стилей – кинематографичный. Он тяготеет к реализму, но с драматической изюминкой. Здесь солирует не столько сам персонаж, сколько атмосфера, создаваемая светом и композицией кадра. Хотите получить изображение, будто вырезанное из дорогого голливудского фильма? Тогда придётся немного окунуться в терминологию кинопроизводства. Не стоит пугаться, всё довольно просто. Такие слова, как «cinematic lighting» (кинематографичный свет), «dramatic shadows» (драматичные тени) и «rim light» (контурный свет), творят настоящие чудеса.
Давайте рассмотрим конкретный пример. Представим, что мы хотим создать портрет детектива в стиле нуар. Вот добротный промт, который можно взять за основу:
Detailed portrait of a tired middle-aged detective in a fedora hat, sitting in a dark office, smoke from a cigarette swirling in the air, light coming from a desk lamp creating hard shadows on his face, cinematic, film noir style, shot on Arri Alexa, hyperrealistic, 8K.
Что мы здесь видим? Чёткое описание героя и обстановки. Упоминание дыма как элемента, добавляющего динамики. Прямое указание на источник света (настольная лампа) и характер теней. Ну и, конечно же, отсылки к стилю нуар и даже к конкретной модели камеры (Arri Alexa), что даёт нейросетям намёк на желаемую цветокоррекцию и зернистость.
Героика и фэнтези: от викинга до кибер-самурая
Ещё один неисчерпаемый кладезь идей – героические и фэнтезийные образы. Здесь можно дать волю фантазии. Однако и тут есть свои подводные камни. Если просто попросить «викинга», результат может получиться довольно шаблонным и даже комичным, с рогатым шлемом, которого у исконных скандинавов никогда и не было. Секрет успеха – в деталях и отсылках к работам известных художников, которые работали в этом жанре. Упоминание имён вроде Фрэнка Фразетты или Бромма мгновенно настраивает нейросеть на нужный лад.
К примеру, создадим образ могучего воина. Промт может выглядеть так:
A stoic Viking chieftain with braided grey hair and a thick beard, wearing ornate leather and fur armor, standing on the edge of a cliff overlooking a misty fjord, holding a battle axe. Dynamic pose, epic fantasy art, style of Frank Frazetta and Todd Lockwood, dramatic lighting, highly detailed.
В этом запросе мы не только описываем внешность и доспехи, но и задаём величественную позу, а также эпичный пейзаж на фоне. Стилистическая привязка к двум мастерам фэнтези-арта гарантирует нам мощный, колоритный и далёкий от стереотипов результат. Выглядит впечатляюще.
Стоит ли бояться сложных терминов?
Обязательно ли знать, что такое «глубина резкости» или «анаморфный блик»? Вовсе нет. Но владение даже базовой технической лексикой из мира фотографии и кино выводит качество генераций на совершенно новый уровень. Это ваш спасательный круг в море однотипных картинок. Например, добавив в запрос «shallow depth of field», вы получите красивый размытый фон (эффект боке), который выделит главного героя. А фраза «volumetric lighting» заставит лучи света выглядеть более плотными и осязаемыми, особенно в пыльном или задымлённом помещении.
Не стоит перебарщивать и превращать промт в техническое задание для инженера. Достаточно добавить два-три уточняющих термина. К примеру, указание на соотношение сторон «–ar 16:9» или «–ar 3:4» (синтаксис может отличаться в разных нейросетях) сразу задаст нужный формат кадра – горизонтальный или вертикальный. А такие термины, как «Unreal Engine» или «Octane Render», намекнут алгоритму, что вы хотите получить картинку, близкую к современной игровой графике – с реалистичными текстурами и сложным освещением. Тем более что нейросеть часто сама подсказывает удачные комбинации.
Автомобильная тематика
Классика жанра. Машины – это не просто средство передвижения, это объект культа для многих мужчин. И здесь тоже есть свои нюансы. Чтобы автомобиль на сгенерированном изображении не выглядел как пластиковая игрушка, стоит уделить внимание окружению и эффектам. Важную роль играют отражения на полированном кузове, свет фар, блики на мокром асфальте. Кроме того, не скупитесь на указание точной модели и года выпуска, если речь идёт о конкретном автомобиле.
Процесс не сложный, но кропотливый. Попробуем создать динамичную сцену с маслкаром. Запрос может быть таким:
A classic 1969 Ford Mustang Boss 429 drifting around a corner on a wet, neon-lit street in nighttime Tokyo, motion blur, reflections on the wet pavement, anamorphic lens flare, cinematic shot, vibrant colors, detailed.
Здесь мы задаём не только легендарную модель, но и самобытный антураж – ночной Токио с его неоновыми вывесками. Эффекты «motion blur» (размытие в движении) и «anamorphic lens flare» (характерные горизонтальные блики от фар) придадут сцене невероятный динамизм и кинематографичность.
В конечном счёте, создание промтов – это творческий процесс, близкий к искусству. Не бойтесь смешивать стили, добавлять неожиданные детали и нарушать правила. Иногда самые грандиозные результаты рождаются из самых безумных и нелогичных, на первый взгляд, запросов. Экспериментируйте, совмещайте несовместимое, и тогда цифровой холст подарит вам настоящий шедевр. Удачи в творческих поисках.