Промт для фото с ребёнком

Плохой сон нейрохудожника — это не всегда искажённые кисти рук или лишние конечности в кадре. Зачастую настоящий ужас вызывает попытка сгенерировать реалистичный детский портрет. К созданию идеальных пластиковых лиц искусственный интеллект откровенно тяготеет, напрочь лишая их естественной живости и текстуры. Буквально десятилетие назад детальная настройка кожи была роскошью даже для опытных ретушёров, но сейчас технологии шагнули далеко вперёд. Однако спектр генерируемых объектов не ограничивается глянцевыми журнальными обложками, здесь требуется щепетильный подход. А начать стоит с понимания базовой структуры текстового запроса.

Как выбрать стиль?

Именно с этой мелкой детали начинается магия портрета. С воздухообменом дело обстоит сложнее, но в виртуальной студии атмосфера целиком подчиняется вашим словам. Выбор правильного освещения творит чудеса. Ну и, конечно же, не стоит забывать про объектив. Добротный портретный фикс всегда солирует в таких задачах. К слову, обыватель редко замечает разницу между мягким софтбоксом, отражённым от белой стены светом, заполняющим контровым лучом. А ведь именно эта инструментальная последовательность формирует внушительный объём. Запрос в духе «child looking at camera, studio lighting, 85mm lens, softbox, highly detailed» станет хорошей отправной точкой. Впрочем, иногда на финальном рендере всплывут артефакты кожи.

Ошибки генерации: Анатомия

Стоит ли экономить токены на описании глаз? Вовсе нет. На самом деле, детские взгляды алгоритмы часто делают слишком взрослыми. Это пугает. Потому что стирается грань. Между возрастом. Скрупулёзный контроль над анатомией — спасательный круг для любого креатора. Сначала прописывается форма лица, затем задаётся текстура кожи с лёгким румянцем, после чего формируется небрежная причёска. Такой хронологический подход позволяет избежать пугающей симметрии. К тому же, львиная доля брака оседает именно на этапе прорисовки мимики. Не стоит перегружать промт излишней детализацией морщинок (их у малышей попросту нет). Тем более, что цифровой мозг склонен к гиперреализму.

На какой объектив снимать?

Многие считают, что широкий угол добавит динамики кадру, но на самом деле он лишь исказит пропорции лица. Естественно, искажённое чадо вряд ли кому-то понравится.

Изысканный винтажный объектив, наоборот, внесёт лепту в создание правильной атмосферы. Попробуйте использовать в запросах упоминание конкретной оптики. Знаменитый советский Гелиос со своим закрученным боке приковывает внимание к центру композиции безотказно. Безусловно, это серьёзное вложение времени в эксперименты, но результат того определённо стоит. Фотореализм здесь льётся рекой. А вот оригинальное название плёнки в конце промта добавит колоритный шум. Плёнка Kodak Portra 400 справится с этой задачей идеально.

Гардероб и антураж

Задача не из лёгких. Ведь именно одежда формирует настроение снимка. Не скупитесь на описание тканей. Вязаный свитер крупной вязки, надетый поверх льняной рубашки, дополненный вельветовыми брюками, создаст очень уютный образ. Наляпистость тут ни к чему. Разумеется, вычурный костюм супергероя тоже имеет право на жизнь, однако исконно портретная классика требует спокойных пастельных тонов. С одной стороны, хочется добавить ярких красок, с другой — они сильно отвлекут от эмоций на лице. Ложка дёгтя в генерациях — это случайные логотипы на футболках. Их появление всегда бросается в глаза. Поэтому стоит заранее прописывать «plain clothes» или «solid color t-shirt». Да и самим виртуальным моделям так будет куда проще выглядеть в кадре естественно.

Стоит ли добавлять родителей?

Сложно ли стилизовать семейную фотосессию? Да, но результат определённо порадует заказчика. В представлении многих генерация нескольких людей одновременно мгновенно превращается в хаос. Это связано с тем, что сеть путает черты лиц разных персонажей. Однако грамотное позиционирование решает проблему легко. Сначала указывается главный объект на переднем плане, затем на заднем фоне размыто прорисовывается фигура взрослого, после чего общая композиция объединяется тёплым светом. Обе стороны медали здесь очевидны. Вы получаете интересный сюжет, но рискуете потерять детализацию глаз малыша. Кстати, не стоит забывать про физическое взаимодействие. Фраза «father holding child’s hand» работает в разы лучше абстрактного слова «family».

Локации в Midjourney: Парк

Когда-то тихое место сейчас превратилось в кладезь идей для цифровых фотографов. Зелень творит настоящие чудеса. Зрелище удручающее, если фон выглядит как сплошное серое пятно. А если ещё вспомнить про золотой час! Солнце, клонящееся к закату, пробивающееся сквозь листву деревьев, освещающее лицо мягким оранжевым светом, создаёт настоящий рай для визуала. Само собой, в текстовом запросе нужно отметить время суток: «golden hour, sunlight filtering through leaves». Подводные камни кроются в сильном пересвете. Иногда алгоритм слишком буквально понимает слово «sunlight». В таких случаях спасает добавление «soft shadows» или «diffused light». Ну, а венчает композицию лёгкая оптическая дымка на заднем плане.

Эмоции

Искренняя улыбка. Добиться её от нейросети довольно сложно. И всё же, это вполне возможно.

Постулаты промпт-инжиниринга гласят, что конкретика всегда важнее абстракций. Вместо банального «happy» лучше использовать «laughing out loud, crinkled eyes, showing teeth».

Такие текстовые махинации заставляют алгоритмы копаться в глубоких слоях своих обучающих данных. Нельзя не упомянуть, что лёгкая детская грусть или задумчивость тоже выглядят впечатляюще. Малыш, смотрящий в окно на капли дождя, облачённый в жёлтый дождевик, вызывает сильный эмоциональный отклик у зрителя. Главное — угадать с палитрой. Холодные синие оттенки меланхолию только усилят.

Как работать с референсами?

Работа с исходниками сильно бьёт по бюджету свободного времени, но она того стоит. Если у вас есть добротный референс, грех им не воспользоваться на практике. В системе Midjourney для этого существует параметр «Image Weight». Дело в том, что именно он определяет, насколько сильно загруженная картинка повлияет на финальный результат. Значение около двойки позу практически скопирует. Разумеется, не сильно ударит по кошельку и использование ControlNet в интерфейсе Stable Diffusion. Этот инструмент позволяет разложить по полочкам позу, выражение лица, глубину резкости. Заслуживает истинного уважения тот факт, что технологии дали нам такой тотальный контроль. А ведь ещё недавно мы могли лишь надеяться на слепую случайность.

Специфика форматов

Выбор соотношения сторон очень большой. Вертикальные узкие кадры откровенно тяготеют к социальным сетям. Горизонтальные широкие форматы чаще используются для сайтов. К первой группе относится классическое девять к шестнадцати, далее следует универсальный квадрат, ну и, наконец, кинематографичное шестнадцать к девяти. Не стоит гнаться за широким форматом, если планируется крупный лицевой портрет. Пустое пространство по бокам может сыграть с композицией злую шутку. К тому же, генерация дополнительных пикселей всегда требует больше ресурсов от видеокарты. Самобытный квадратный формат, отсылающий к старым полароидным снимкам, часто становится той самой визуальной изюминкой проекта.

Влияние стилистики на результат

Стоит задуматься и о художественном стиле заранее. Фотореализм — далеко не единственный путь. Иногда сказочный книжный антураж куда уместнее. Иллюстрации в духе старой акварели, прорисованные тонкими линерами, раскрашенные пастельными полутонами, обладают своим неповторимым шармом. Окунуться в мир фэнтези довольно просто. Достаточно добавить в строку запроса имена известных детских иллюстраторов или названия конкретных художественных течений. Впрочем, здесь нужен очень тонкий баланс. Бомонд цифрового искусства давно отверг чистый плагиат чужих стилей, предпочитая их грамотное смешивание. Не перегружайте запрос десятком имён художников, выберите два-три варианта. Иначе получится весьма неоднозначный эффект.

Динамика в кадре

Статика быстро утомляет. Когда ребёнок уверенно стоит на ногах и бежит за летящим мячом, кадр моментально оживает. Захватить движение довольно сложно, но игра точно стоит свеч. Многие новички грезят идеальными вылизанными портретами в анфас. А ведь именно профиль, снятый в высоком прыжке, передаёт настоящую детскую энергию. Использование слов «motion blur», «running», «dynamic angle» привычную статичность помогает сломать. Грандиозный провал часто получается при попытке сгенерировать мелкие игрушки в руках. Сеть постоянно сращивает цветной пластик с пальцами модели. Поэтому лучше отказаться от сложных предметов в кадре. Пусть малыш просто тянется ручками к мыльным пузырям.

Оптика и фокусное расстояние

Начинать настройку камеры нужно с понимания перспективы. Тридцать пять миллиметров дадут вам отличный широкий угол обзора. Но именно искажения по краям кадра такие объективы создают довольно часто. Для пропорций лица это критично. А вот длиннофокусная тяжёлая оптика геометрию сжимает бережно. К тому же, задний план она размывает в красивое мягкое молоко. Нельзя не упомянуть знаменитый эффект глубокого боке. Круглые светящиеся блики от гирлянд, расположенные далеко за спиной модели, перекрытые лёгкой вечерней дымкой, превращают скучный снимок в кинематографичный шедевр. Безусловно, прописать «shallow depth of field» в самом начале промта всё-таки стоит.

Вам предстоит огромное множество увлекательных экспериментов с весами слов и сидами генераций. Кошелёк станет легче от оплаты продвинутых нейросетей, но каждый неудачный дубль лишь приближает к пониманию внутренней логики машины. Пусть ваши виртуальные модели оживают с первой попытки, а процесс текстового написания приносит исключительно творческое удовлетворение!