В сети представлено множество красивых генераций, но на практике добиться реалистичной человеческой кожи и живого взгляда от нейросети оказывается довольно сложно. Многие считают, что достаточно вбить десяток синонимов красоты, но на самом деле алгоритм быстро путается в абстракциях, выдавая глянцевых манекенов. Устав от суеты с бесконечным рероллом, опытные криэйторы переходят к жёсткому структурированию запросов, где каждое слово имеет свой математический вес. Буквально десятилетие назад исследователи только мечтали о таком уровне визуального контроля, заставляя машины рисовать абстрактные пятна на серверах мощностью в сотни мегаватт, а сейчас любой желающий творит чудеса прямо в браузере. Поэтому перед генерацией желательно полностью пересмотреть саму архитектуру текстового ввода.
Зачем переплачивать за нейросети? Экономьте сотни долларов каждый месяц 💸
Оплачивать Midjourney, премиум-версии ChatGPT, видео- и аудио-генераторы по отдельности — это безумно дорого и неудобно. Этот сервис решает проблему! Получите полный пакет премиум-моделей (более 90 топовых нейросетей) по цене одной доступной подписки. Безлимитные возможности, никаких скрытых платежей и сгорающих токенов при активном тарифе.
Перестаньте платить за 10 разных сайтов. Выбирайте выгоду и творите без ограничений 👉 https://clck.ru/3RNCRL
Стоит ли усложнять запрос?
Зададим вопрос: всегда ли длинный текст гарантирует шедевр? Вовсе нет. В правильной последовательности технических маркеров, а не в их количестве кроется львиная доля успеха. Начинается скрупулёзный рабочий процесс с указания типа камеры, дополненного фокусным расстоянием, приправленного названием конкретной плёнки. К слову, плёночное зерно творит настоящие чудеса, когда нужно скрыть генеративные артефакты. Не стоит перегружать модель эмоциями, лучше описать микромимику лица. Слегка приподнятая бровь работает гораздо точнее обобщённого понятия радости. Это же правило касается и освещения. Ведь именно свет задаёт весь антураж кадра. Тем более, что светлые участки алгоритмы просчитывают гораздо охотнее глубоких теней.
Портретная съёмка в студии
Скулы мягко освещает свет от софтбокса. Так начинается классическая настройка студийного освещения (обычно имитируется схема Рембрандта или бабочки). На выходе получается добротный глянцевый кадр. Стоит отметить базовую конструкцию для такого случая:
«medium format portrait, 35 years old woman, cinematic lighting, Hasselblad H6D-100c, 85mm lens, f/1.8, softbox illumination, intricate skin texture, visible pores, subdued background, 8k resolution».
Впрочем, здесь есть свои подводные камни. Лицо моментально превратится в гладкую пластиковую маску, если не указать дефекты кожи или поры. К тому же, добавление слов вроде «freckles» или «slight wrinkles» вносит необходимую лепту в реализм. Зрелище, когда машина рисует идеальную кожу без изъянов, сейчас вызывает скорее удручающее впечатление у профессионалов.
Оптика
А вот параметры объектива стоит вынести в отдельную категорию. Разумеется, выбор фокусного расстояния напрямую диктует геометрию лица и сжатие пространства. Нос неизбежно вытянут тридцать пять миллиметров. Привычную глазу картинку дадут пятьдесят миллиметров. Отделив модель от заднего плана, идеальную компрессию фона создадут восемьдесят пять миллиметров. Это надёжно. Потому что проверено. Временем и миллионами тестовых прогонов. Нельзя не упомянуть влияние конкретных брендов плёнки на колоритный винтажный результат. Тёплые оттенки кожи вытянет запрос «Kodak Portra 400». В глубокую мадженту уведёт тени выбор «Fujifilm Superia 400». Ну и, наконец, «Ilford HP5» станет отличным решением для контрастного монохромного нуара. Использование этих маркеров не сильно ударит по кошельку, ведь виртуальная плёнка бесплатна, но качество картинки взлетит до небес.
Как выбрать локацию для стрит-стайла?
Сквозь густую листву пробивается солнечный блик, скользя по волосам. Работать со стрит-стайлом довольно интересно, но процесс требует чёткого понимания времени суток. Тёплый предзакатный объём, прорисовывая силуэт, формирует запрос «golden hour lighting, backlit, harsh shadows». Далее следует логичный переход к пасмурной погоде через конструкцию «overcast soft light, diffused daylight», скрывающую резкие переходы света. Конечно, можно довериться случайности, однако контролируемый свет всегда бьёт точно в цель. С одной стороны, нейросети любят яркое солнце, с другой — мягкий рассеянный свет даёт более изысканный кинематографичный результат. В представлении многих обывателей уличная съёмка требует лишь указания локации, но без прописанного освещения персонаж просто слипнется с фоном в плоскую картинку.
Фэшн-индустрия в объективе
Наряд для избранных. Высокая мода требует от текстового задания максимальной детализации текстильных материалов. В кашу алгоритм превращает текстуры, если не разложить их по полочкам с помощью грамотного синтаксиса. Тяжёлый бархатный пиджак, расшитый золотыми нитями, надетый поверх тонкого шёлкового платья, прописывается через строгие словесные блоки:
«haute couture editorial, full body shot, avant-garde outfit, heavy crimson velvet jacket with gold embroidery, sheer silk dress underneath, dramatic studio lighting, Vogue magazine cover style, sharp focus».
Безусловно, вычурный наляпистый декор может отвлечь от самого человека. Поэтому фон лучше оставлять нейтральным, используя связку «plain gray backdrop» или «minimalist concrete wall». Очевидно же, что сложная одежда солирует в кадре, требуя к себе стопроцентного внимания зрителя.
Динамика кадра
Застывшее движение всегда приковывает внимание. Имитация динамики — задача не из лёгких, но именно она лишает цифровые фотографии пресловутой статичности. Волосы, развевающиеся на ветру, смазанный фон от проезжающей машины, застывшие капли дождя достигаются специальными формулировками. Физику объектов заставляет просчитывать запрос «motion blur, wind blowing hair, dynamic pose, mid-action shot, flying fabric». Но есть и минусы. Иногда система ошибается, искривляя пропорции тела в попытке передать сложное движение. Не стоит тестировать слишком экстремальные позы в начале пути. Лучше начать с лёгкого шага: «walking towards camera, casual stride, candid street photography». Это же так естественно выглядит. Да и самим алгоритмам проще рассчитать биомеханику обычного шага, чем акробатический прыжок. Кстати, грамотно составленный промт с динамикой — это настоящий кладезь вдохновения для концепт-художников.
Какими бывают ошибки генерации?
Всплывут ли проблемы с анатомией? Обязательно всплывут. Шесть пальцев или нелепо изогнутые конечности — извечная ложка дёгтя в бочке цифрового мёда. Спасательный круг кроется в негативных ограничениях, куда отправляются все страхи творца:
«mutated hands, extra limbs, plastic skin, CGI, 3D render, oversaturated, deformed eyes, cartoon».
Однако не стоит перебарщивать с отрицаниями. Махинации с гигантским списком запретов (около тридцати слов) иногда ломают логику самой композиции. Не стоит гнаться за абсолютным совершенством с первой попытки. Лучше отказаться от излишней паранойи в негативном поле, сосредоточившись на точности позитивного запроса. И всё-таки, если пальцы упорно превращаются в месиво, всегда выручит портретная съёмка по грудь или руки, спрятанные в карманы. Ведь обыватель редко всматривается в микроскопические детали, если общее настроение кадра передано верно.
Цветокоррекция
Мокрый асфальт медленно заливает холодный неоновый свет. Киберпанк и городская ночная съёмка остаются довольно популярными направлениями, где тон играет заглавную роль. Жёсткую бескомпромиссную палитру автор задаёт, прописывая «cinematic teal and orange color grading, cyberpunk aesthetic, neon reflections». И всё же, натуральные цвета смотрятся куда более профессионально и дорого. В суровую реальность возвращают зрителя запросы вроде «muted pastel colors, low saturation, earthy tones, cinematic grading». Особый интерес вызывает имитация старых полароидных снимков. Потёртая бумага, засвеченный край, нерезкий фокус, зернистость эмульсии достигаются через «polaroid sx-70 style, light leaks, vignette, soft focus, retro aesthetic». Естественно, подобная стилизация подходит не для каждой задачи, но она придаёт изображению тот самый самобытный шарм, которого так не хватает стерильному машинному коду.
Детализация глаз
Зрачок жадно ловит и отражает яркий источник света. Именно глаза выдают искусственное происхождение портрета, если не уделить им скрупулёзного внимания. Не скупитесь на тщательное описание взгляда. Внушительный выразительный эффект даёт связка «catchlights in eyes, highly detailed iris, sharp eyelashes, subtle eye makeup». Казалось бы, мелкая техническая деталь, но она кардинально меняет восприятие портрета. Человек всегда инстинктивно ищет зрительный контакт с изображением. Дело в том, что наша психика моментально считывает фальшь в несимметричных, безжизненных или пустых зрачках. Ну и, конечно же, если ещё вспомнить про правильное направление взгляда через указание «looking directly at camera» или романтичное «gazing into the distance», то перевоплощение цифрового пиксельного манекена в живого, мыслящего персонажа становится осязаемым.
Каждый новый эксперимент с текстовыми формулировками расширяет границы визуального искусства. Не стоит бояться сложных оптических схем и нестандартных световых решений, выходя за рамки привычных, затёртых до дыр шаблонов. Грамотная настройка виртуальной камеры и щепетильное внимание к мельчайшим деталям кожи обязательно принесут свои плоды. Пусть каждый сгенерированный кадр обретает свою глубокую суть, а долгий поиск идеального словесного баланса станет для вас самым увлекательным творческим процессом.