В сети представлено множество красивых одиночных портретов, созданных нейросетями, однако генерация многофигурных снимков до сих пор заставляет попотеть даже опытных инженеров. Плохой результат — это не всегда вина алгоритма, зачастую проблема кроется в слишком абстрактном описании. Буквально десятилетие назад детальная настройка виртуального освещения казалась фантастикой, но сейчас полная власть над пикселями находится в руках пользователя. И всё же, когда в кадре появляется более трёх персонажей, логика машины начинает сбоить. А чтобы не ошибиться, нужно выстраивать текстовый запрос по строгим правилам настоящей фотографии.
Ваш личный ИИ-отдел маркетинга, который работает 24/7 📈
Ускорьте создание контента в 10 раз! Этот мульти-ИИ сервис позволяет писать безупречные продающие посты, генерировать уникальные фото для соцсетей, создавать рекламные промо-ролики с нуля и писать для них музыку в пару кликов. Идеальное решение для предпринимателей, маркетологов и SMM-специалистов. Всё в едином удобном интерфейсе — больше не нужно переключаться между десятком вкладок.
Делегируйте рутину искусственному интеллекту и увеличивайте продажи. Начните работу здесь 👉 https://clck.ru/3RNCRL
В чём кроется главная сложность?
Начинает плыть анатомия. Это происходит довольно часто. Ведь алгоритм пытается одновременно удержать в памяти черты лица, позы и взаимодействие объектов. С одной стороны, можно довериться случайности, с другой — лучше сразу взять управление на себя. Не стоит перегружать генерацию десятками мелких деталей на заднем плане. Дело в том, что фокус машины неизбежно сместится, а лица превратятся в кашу. Разумеется, львиная доля успеха зависит от правильного указания базовых параметров. Сначала мы прописываем общий план, затем задаём возраст и пол каждого участника, после чего уточняем их одежду. Ну и, наконец, добавляем описание окружения. К слову, именно такой скрупулёзный подход творит чудеса при работе со сложными композициями.
Атмосфера кадра: влияние фона
Кирпичная стена, обшарпанная штукатурка и приглушённый свет. Именно такие детали часто спасают скучный кадр.
Выбор реальной локации серьёзно бьёт по бюджету, но в нейросети любой антураж создаётся парой слов. Главное — угадать с палитрой. Нельзя не упомянуть, что излишняя наляпистость заднего плана моментально разрушает магию семейного снимка. Поэтому лучше отказаться от пёстрых обоев или шумных городских улиц. Хороший добротный фон должен лишь подчёркивать героев, ведь в композиции всегда солирует семья. Кстати, если добавить в промт упоминание плёночной фотографии, то изображение обретёт тот самый колоритный винтажный дух. Композицию в таких случаях органично венчает мягкая виньетка.
Как настроить освещение?
Света много не бывает? Вовсе нет. Мягкий рассеянный свет от окна (примерно за час до заката) ложится на кожу гораздо благороднее, чем жёсткая студийная вспышка. Впрочем, здесь есть свои подводные камни. Если не указать направление лучей, тени лягут хаотично, а лица приобретут землистый оттенок. Опытный обыватель обычно использует связку из контрового и заполняющего света. Формируется такой объёмный реалистичный рисунок довольно просто. В запрос вписывается фраза «soft volumetric lighting», дополненная указанием на золотой час, усиленная тёплыми бликами на волосах, сбалансированная глубокими тенями в фоне. Безусловно, это серьёзное вложение времени в подбор правильных слов, но результат заслуживает истинного уважения. Освещение моментально приковывает внимание к лицам.
Оптика
Только фокусное расстояние. Именно оно определяет геометрию лиц. Многие грезят о кнопке «сделать красиво», но на самом деле лица по краям кадра часто растягиваются из-за виртуального широкого угла. Чтобы кошелёк стал легче при покупке реального объектива с фокусным расстоянием восемьдесят пять миллиметров, придётся потратить солидную сумму. Здесь же мы просто вписываем «shot on 85mm lens». Тем более, что это фокусное расстояние считается эталонным для портретов. К тому же добавление параметра «f/2.8» красиво размоет фон. Исконно портретные объективы всегда спасали ситуацию, даже самый бюджетный вариант настройки оптики в тексте преображает картинку.
Образец запроса: студийная съёмка
Для начала стоит разобрать базовый шаблон, который представляет собой настоящий кладезь полезных приёмов. В нём нет ничего сложного, но каждая деталь твёрдо стоит на ногах. К первой группе относится само описание сцены, где мы указываем счастливую семью из четырёх человек, сидящую на кожаном диване. Далее следует детализация внешности, где отец с лёгкой небритостью обнимает мать в элегантном платье. Отдельно стоит упомянуть детей, каждое чадо должно быть занято делом или смотреть в камеру. Следующий важный критерий затрагивает техническую часть. Здесь мы прописываем студийное освещение, использование камеры среднего формата и высокое разрешение. Ну, а последним в списке идёт перечисление стилистических параметров, вроде фотореализма и кинематографичной цветокоррекции. Это надёжно. Потому что проверено сотнями генераций. Обе стороны медали учтены: и эмоции, и техника.
Стиль жизни: уличная фотография
Осенний парк. Жёлтые листья под ногами и лёгкая дымка. В такой самобытный антураж хочется окунуться с головой. Для уличной съёмки текст запроса будет немного иным, поскольку технические постулаты меняются на открытом воздухе. Сначала задаём тёплую цветовую палитру, затем прописываем движение в кадре, после чего добавляем случайные детали вроде разлетающихся листьев. Само собой, персонажам лучше облачиться в спокойные тона. Вязаные объёмные свитера, шарфы и грубые ботинки подойдут идеально. Выглядит впечатляюще. Бомонд мира генеративной графики часто использует такие сюжеты для тестирования новых моделей. Ведь здесь машине приходится обрабатывать сложный свет, который буквально льётся рекой сквозь ветви деревьев. Вычурный декор здесь лишний, ставка делается на естественность.
Нужно ли прописывать эмоции?
Конечно, да. Без них герои будут смотреть в объектив с пугающим спокойствием манекенов. Естественно, заставить нейросеть сгенерировать искренний смех — задача не из лёгких. Стоит задуматься о взаимодействии персонажей. Пусть они смотрят друг на друга, а не в камеру. Внести лепту в реалистичность поможет указание мелких морщинок вокруг глаз при улыбке. Ведь именно такие нюансы отличают настоящую фотографию от пластиковой штамповки. Да и самим виртуальным людям так выглядит гораздо естественнее. Однако не стоит перебарщивать с экспрессией. Иначе лица исказятся до неузнаваемости. Но есть и ложка дёгтя. Алгоритм сильно тяготеет к симметрии, поэтому часто натыкаешься на неестественно ровные зубы или абсолютно одинаковые улыбки у всех членов семьи.
Чем плёночная стилизация лучше цифровой?
Цифра часто грешит излишней резкостью. Каждая пора на коже буквально бросается в глаза. С одной стороны — это показывает мощь алгоритма, с другой — делает снимок искусственным. Аналоговая эстетика с её зерном и несовершенствами сглаживает эти шероховатости. Спасательный круг для тех, кто устал от вылизанных журнальных картинок. Нужно отметить, что добавление в промт названий конкретных плёнок (например, Kodak Portra 400 или Fujifilm Superia) кардинально меняет цветопередачу. Кожа приобретает тёплый персиковый оттенок. Да и в целом картинка становится более живой, пыль красиво оседает в лучах света. Получается изысканный классический портрет.
Сборка идеального текстового запроса требует терпения и понимания базовых принципов фотографии. Ошибки обязательно всплывут (особенно на первых этапах), но каждый неудачный кадр становится ступенькой к мастерству. Все эти текстовые махинации направлены на одно — заставить нейросеть мыслить категориями физического света и оптики. Главное — не бояться экспериментировать с ракурсами и взаимодействием героев. Разложить по полочкам все переменные сразу не получится, однако со временем интуиция начнёт подсказывать верные слова, а внушительный опыт заменит любые шпаргалки. Пусть ваш следующий генеративный шедевр соберёт множество восхищённых взглядов, а сам процесс создания принесёт массу удовольствия и порадует домочадцев!