Промт для портрета поколений

Сгенерированные лица слишком часто отдают неестественным глянцем, а попытка объединить в одном кадре бабушку из суровых пятидесятых и зумера с цветными волосами обычно оборачивается абсолютной визуальной кашей. Обыватель привык довольствоваться плоскими и безжизненными картинками, но для профессиональной работы такой подход совершенно непригоден. Ведь передать дух времени через нейросеть — задача не из лёгких. Требуется скрупулёзный подбор параметров генерации, где каждая переменная играет свою роль. Но чтобы не ошибиться, нужно грамотно выстроить текстовый запрос, разложив по полочкам оптику, текстуры и исторический антураж.

С чего начинается выбор? С определения эпохи

Мягкий плёночный фильтр, наложенный поверх цифрового шума, сразу задаёт нужное настроение кадру. С чего начинается выбор? С определения тех самых маркеров, которые отличают одно десятилетие от другого. К слову, львиная доля ошибок всплывает именно на этапе описания освещения. Размытый фон, усиленный хроматическими аберрациями, отлитый в форму старой фотографии, создаёт ту самую изюминку. А ведь алгоритмы изначально тяготеют к идеальности. Поэтому стоит сразу задавать параметры несовершенства. Не стоит забывать про вес токенов. При перегрузке лишними эпитетами смысл теряется, а итоговая картинка бьёт по визуальному восприятию своей наляпистостью. Однако грамотно выстроенная структура спасает ситуацию.

Атмосфера разных лет

Буквально десятилетие назад генерация реалистичных людей казалась фантастикой, но сейчас технологии шагнули далеко вперёд. Кстати, для портрета миллениалов отлично работает связка токенов с упоминанием цифровых мыльниц начала двухтысячных. Далее следует описание одежды, где солирует старый потёртый деним или велюровые спортивные костюмы. К первой группе референсов относится эстетика гранжа. Следующий важный критерий кроется во внешности бумеров. Для них стоит прописывать более строгие, структурные тени и классический гардероб. Отдельно стоит упомянуть старшее поколение. Лица этих людей нуждаются в максимальной детализации морщин, пигментных пятен и текстуры кожи. Ну и, конечно же, всё это великолепие нужно объединить правильным светом.

Свет и оптика

Фокусное расстояние решает всё. Это факт. Ведь искажение пропорций лица моментально разрушает магию.

Разумеется, использование полтинника (объектива 50mm) — надёжный проверенный вариант. Дуплекс света и тени — это основа глубокого кадра. На самом деле, запросы вида «студийное освещение, софтбокс, контровой свет» работают довольно неплохо. Но есть и минусы. Искусственность таких конструкций сильно бросается в глаза. Гораздо лучше отрабатывают фразы с указанием конкретного времени суток и погодных условий. Свет, пробивающийся сквозь пыльные жалюзи, добавляет сцене колоритный антураж. К тому же, объёмный кинематографичный свет подчёркивает разницу в текстурах кожи героев. Нельзя не упомянуть и про настройки рендера. Указание движков вроде Unreal Engine 5 или Octane Render делает кошелёк токенов чуть легче, но результат того стоит.

Как избежать пластиковых лиц?

Почему генерации так часто выглядят как манекены? Всё дело в базовых настройках моделей, которые методично сглаживают дефекты. Безусловно, добавление фраз вроде «hyper-detailed skin pores, peach fuzz, microscopic imperfections» вносит свою лепту в создание шедевра. Зрелище удручающее, когда вместо живой бабушки натыкаешься на отфотошопленную модель. Дело в том, что искусственный интеллект не понимает концепции старения. Для него морщины — это просто линии. Поэтому стоит использовать термины из дерматологии. Тем более что нейросети отлично обучены на огромных медицинских архивах. А вот негативный запрос — настоящий спасательный круг. Огромный массив слов льётся рекой в блок исключений. Сюда отправляются пластик, 3D, ретушь, симметрия. Впрочем, не стоит перебарщивать с отрицательными весами. Иногда лёгкая асимметрия, заданная в основном поле, творит чудеса.

Одежда как зеркало времени

Воротнички из кружева. Мелкие пуговицы. Ведь именно гардероб приковывает внимание зрителя в первую очередь. Нужно отметить, что каждое поколение имеет свой самобытный стиль. Исконно традиционные наряды начала прошлого века требуют указания конкретных тканей (лён, грубая шерсть, ситец). Семья — это далеко не всегда светский бомонд, поэтому откажитесь от фраков, если генерируете простых рабочих. Затем прописывается одежда среднего поколения, где часто мелькает добротный советский крой. Последним в списке идёт гардероб зумеров с их оверсайзом и яркими принтами. Каждое чадо должно быть одето соответственно своей эпохе. Изысканный наряд прабабушки сильно контрастирует с рваными джинсами подростка. Такая разница поколений твёрдо стоит на ногах именно благодаря деталям.

Окружение и локации

Где именно оседает пыль эпох? В интерьерах. Вычурный декор на фоне современных гаджетов смотрится странно, поэтому локацию прописывают крайне щепетильно. Естественно, старый бабушкин ковёр на стене или хрусталь в серванте добавляют реализма. Квартира, обставленная в стиле семидесятых, усиленная тёплым светом торшера, проработанная до мельчайших трещин на обоях, погружает в ностальгию. Грандиозный масштаб здесь не нужен, камерность работает гораздо эффективнее. Да и самим персонажам комфортнее находиться в естественной среде. Многие считают, что фон можно просто размыть сильным боке, но на самом деле именно артефакты на заднем плане рассказывают историю семьи.

Региональный контроль

Смешивание лиц — главная ложка дёгтя в генерации групповых портретов. Ведь ИИ обожает применять седину ко всем персонажам сразу. Естественно, выручают расширения вроде Regional Prompter. Экран просто делится на вертикальные зоны. В первой колонке прописывается старец, облачённый в твидовый костюм. Во второй зоне солирует женщина средних лет. Ну, а в третьей части кадра располагается подросток. Такой подход требует времени, но он того стоит. Тем более что без чёткого разделения кошелёк станет легче из-за сотен неудачных попыток, а нужный результат так и не появится.

Тонкая настройка параметров

Технические термины пугают? Поначалу да. Однако внушительный список модификаторов — это настоящий кладезь возможностей для художника. Само собой, покупка мощной видеокарты — серьёзное вложение, которое сильно бьёт по бюджету, но локальная генерация даёт полный контроль. Бюджетный облачный вариант тоже имеет право на жизнь, хотя там часто всплывают махинации с цензурой. Сложно ли настроить веса каждого слова? Да, но результат оправдывает ожидания. При значении CFG Scale около семи или восьми нейросеть выдаёт самый адекватный результат. Если же выкрутить этот параметр, изображение приобретёт неоднозначный и резкий характер. Обе стороны медали важны: и креативность запроса, и математическая точность настроек. Подводные камни часто кроются в конфликте токенов, когда алгоритм не понимает, чьи именно волосы нужно сделать седыми.

Стоит ли использовать референсы?

Можно ли полагаться только на текст? Скорее нет, чем да. Функция переноса стиля из исходной картинки существенно облегчает жизнь. Сначала загружается старое семейное фото, а затем поверх накладывается текстовая надпись. При низких значениях влияния исходника результат получается откровенно скучным. А если дать алгоритму свободу, он дорисует лишние пальцы. Ну и, наконец, стоит задуматься о цветокоррекции. Уж лучше потратить время на качественный апскейл с добавлением шума. Хороший винтажный пресет, наложенный на финальном этапе, скроет мелкие огрехи генерации. Эксперименты с весами токенов и оптикой обязательно потребуют времени. Не бойтесь смешивать эпохи, добавляя щепетильно подобранные детали гардероба и специфическое освещение для каждого участника кадра. Пусть каждый сгенерированный снимок станет настоящим отражением времени, а готовый результат обязательно порадует домочадцев и заказчиков.