В сети представлено множество до смешного нелепых изображений, где у людей по шесть пальцев, а вместо лиц сияют жутковатые размытые пятна. Устав от суеты с арендой студий, утомительным поиском визажистов и подбором гардероба, обыватель всё чаще обращается к нейросетям за красивой картинкой. Многие считают, что достаточно просто попросить алгоритм нарисовать привлекательную девушку в платье, но на самом деле результат часто разочаровывает. Ведь цифровая генерация требует чёткого понимания механизмов и правильного подбора слов. А чтобы не ошибиться, нужно тщательно выстраивать текстовые запросы, превращая их в подробные инструкции.
Как работают текстовые запросы?
С чего начинается осознанная работа? С определения главной визуальной идеи. Буквально десятилетие назад подобные технологии казались абсолютной фантастикой, а сейчас виртуальный бомонд активно использует искусственный интеллект для создания глянцевых обложек. Дело в том, что машина категорически не понимает человеческих абстракций. К слову, львиная доля неудачных картинок возникает именно из-за скудости и сухости описания. Придётся разложить по полочкам каждую мелочь, начиная от типа освещения и заканчивая текстурой ткани. И всё же процесс этот не сложный, но довольно кропотливый. Выручит здесь насмотренность и базовое знание фотографических терминов. А если ещё вспомнить про параметры виртуальных камер, то картинка сразу приобретёт добротный студийный вид. Нужно отметить, что нейросети часто тяготеют к излишнему украшательству.
Базовый портрет
Блик на левой скуле и лёгкая тень под подбородком. Именно с таких мельчайших деталей начинается построение по-настоящему живого лица в кадре. Сложно ли добиться естественности человеческой кожи? Да, но результат того определённо стоит. Поможет в этом скрупулёзный подход к описанию схемы освещения. Один из самых популярных видов генерации начинается с указания типа камеры и конкретного фокусного расстояния. Далее следует описание самого персонажа, наделённого узнаваемыми чертами, после чего прописывается фон и общая атмосфера. В качестве отличного примера можно взять такой запрос:
молодая женщина тридцати лет, лёгкая улыбка, объектив восемьдесят пять миллиметров, диафрагма один и восемь, мягкий оконный свет, гиперреализм, разрешение восемь ка.
Конечно, иногда на финальном рендере всплывут артефакты, однако правильный отрицательный текст спасает ситуацию. Не стоит забывать прогонять готовый результат через инструменты улучшения лиц (так называемые апскейлеры).
Стилистика киберпанка в городе
Декорации в любой композиции имеют просто огромное значение. Главная изюминка качественной уличной съёмки кроется в детально проработанном фоне. Ведь именно он создаёт тот самый колоритный городской антураж и позволяет с головой окунуться в атмосферу. Разумеется, просто написать слово «улица» будет совершенно недостаточно для получения шедевра. В представлении многих неопытных алгоритмов это может оказаться пустой серой дорогой. А вот если добавить неоновые вывески, мокрый асфальт и отражения, то композиция моментально оживает. Тем более, что контрастный контровой свет творит чудеса с объёмом в кадре. Следующий важный критерий кроется во времени суток. Попросите нейросеть сгенерировать золотой час или глубокие сумерки. Хорошим рабочим вариантом станет следующий промт:
мужчина в длинном кожаном пальто, Токио будущего, идёт проливной дождь, кинематографичное освещение, съёмка на киноплёнку, зернистость, глубокие тени, фокус на лице.
Зрелище получается удручающее в хорошем смысле этого слова — мрачное, густое, нуаровое. К тому же, такой подход не сильно бьёт по бюджету, в отличие от реальной поездки за границу.
Вредно ли перегружать текст деталями?
Задача генерации идеального кадра далеко не из лёгких. Текст иногда превращается в настоящую махинацию со множеством неизвестных переменных. Обязательно ли вписывать десятки эпитетов подряд? Вовсе нет. Наляпистость в запросе часто приводит к тому, что алгоритм просто игнорирует половину написанных слов. Ложка дёгтя кроется в ограниченном окне внимания математической модели. Сначала обрабатываются первые понятия, а концовка длинного абзаца часто теряется из виду. Поэтому стоит выносить самое важное в самое начало строки. Сначала прописывается объект, затем задаётся окружение, ну и, конечно же, вбиваются технические параметры. Исконно правильная структура выглядит как перевёрнутая пирамида. Впрочем, иногда случайная опечатка может внести свою лепту и выдать совершенно изысканный неожиданный результат. Нельзя не упомянуть, что многие начинающие пользователи грезят о стопроцентном контроле над машиной. Вырастить идеальный кадр с первой попытки практически невозможно, но последовательные вдумчивые правки обязательно приведут к заветной цели.
Студийный глянец
Шелест дорогого шёлка, слепящий блеск софитов. Атмосфера модной журнальной съёмки всегда приковывает внимание зрителя. Чтобы органично облачить вашего виртуального персонажа в вычурный наряд, придётся детально описать фактуру ткани. Бархат, гладкий атлас, грубая шерстяная вязка — всё это обученная машина прекрасно понимает. Безусловно, здесь солирует именно текстура материала. А чтобы она по-настоящему заиграла, нужен жёсткий направленный свет. Настоящий рай для виртуального творца наступает при использовании конкретных фотографических схем освещения. Например, можно использовать схему «бабочка» или поставить классический рисующий свет. Рабочий промт формулируется так:
фэшн фотография, девушка с короткими рыжими волосами, красное шёлковое платье, студийный фон оливкового цвета, жёсткий свет софтбокса, высокая детализация пор кожи, съёмка для модного журнала.
Выглядит впечатляюще на любом экране. Заслуживает истинного уважения то, как точно современные алгоритмы передают мельчайшие блики на влажных губах и глазах.
Подводные камни
Огромное количество визуального мусора ежедневно оседает на жёстких дисках криэйторов. Часто натыкаешься на откровенный брак, листая ленты социальных сетей. Обе стороны медали виртуального творчества стоит принимать как данность. Красивая яркая картинка часто таит в себе мелкие недочёты, сильно бросающиеся в глаза при детальном рассмотрении. Лишние конечности, неестественно слипшиеся волосы или асимметричные зрачки — с этим регулярно сталкивается каждый. Это же суровое правило касается и заднего плана. Где-то может парить в воздухе кофейная чашка, а где-то старинное здание венчает несуществующая кривая крыша. Надёжный спасательный круг здесь — это грамотно составленный негативный промт. Туда стоит вписать всё то, чего вы категорически не хотите видеть на финальном рендере. Обычно в этот блок отправляются такие понятия: мутация, плохое качество, размытие, лишние пальцы, текст, уродливые пропорции, водяные знаки. Да и самим художникам значительно комфортнее работать, когда рамки дозволенного чётко заданы. Кстати, некоторые предпочитают использовать числовые веса для отдельных слов, усиливая или ослабляя их математическое влияние. Это щепетильный, неоднозначный, но крайне полезный нюанс, спасающий композицию.
Свадебное платье в морском стиле
Тёплый белый песок и монотонный шум прибоя. Когда-то тихое уединённое место сейчас превратилось в идеальную локацию для пышных фотосессий, пусть и созданных искусственным интеллектом. Чтобы чадо или взрослая модель органично смотрелись на фоне бушующего океана, стоит задать правильное время дня. Полуденное палящее солнце даёт слишком резкие чёрные тени на лицах (особенно глубоко под глазами). Поэтому идеальным решением станет упоминание предзакатного спокойного времени. Промт можно смело сформулировать так:
невеста в кружевном белом платье, идёт по пляжу Малибу, на заднем плане океанские волны, время перед закатом, тёплый оранжевый свет, съёмка на объектив тридцать пять миллиметров, эффект боке.
Само собой, полупрозрачная вода и солнечные блики всегда получаются у нейросетей просто превосходно. Ну, а лёгкий морской ветер в распущенных волосах добавит кадру необходимой живости. Фантазия здесь льётся рекой, не ограничиваясь привычными физическими законами.
Стоит ли использовать референсы?
Обязательно ли полагаться в работе исключительно на сухой текст? Вовсе нет. Современные удобные интерфейсы позволяют загружать собственные исходные фотографии. И это действительно внушительный грандиозный технологический скачок. Процесс генерации по загруженной картинке помогает сохранить изначальную позу или общую сложную композицию. Вся суть кроется в том, что алгоритм берёт за основу загруженный силуэт, а текстовый промт использует лишь для наложения совершенно новых деталей. Это удобно. Ведь модель больше не будет зависеть от случайных хаотичных фантазий сети. Кроме того, такой подход позволяет делать забавные реалистичные перевоплощения собственных домашних фотографий. Загрузили обычное селфи, написали промт про тяжёлые рыцарские доспехи, нажали заветную кнопку. Перевоплощение завершено.
Постулаты цветокоррекции
Настройка цвета требует отдельного пристального внимания. Самобытный плёночный цвет придаёт цифре благородства. Заданная в тексте цветовая палитра радикально меняет настроение всего снимка. Хотите получить холодный скандинавский детектив? Довольно просто. Добавьте в строку слова про приглушённые тона, циановый оттенок и пасмурное небо. А вот для тёплой летней карточки подойдут упоминания кодака, пастельных оттенков и сочных зелёных тонов. Оснащённая мощными видеокартами, обученная на миллионах профессиональных снимков, дополненная пользовательскими скриптами нейросеть мгновенно отреагирует на такие маркеры. Уверенно стоит на ногах этот метод стилизации, превращая любой набросок в шедевр. Не скупитесь на упоминания конкретных типов фотоплёнки в своих запросах. Кладезь вдохновения можно легко найти в старых журналах. Например:
портрет девушки, плёночная фотография Кодак Портра четыреста, мягкие пастельные цвета, лёгкая зернистость, естественное освещение.
Этот бюджетный элегантный способ стилизации работает безотказно на большинстве современных генераторов.
Поэтому не стоит бояться экспериментировать с настройками. Каждый новый сгенерированный кадр неумолимо приближает вас к пониманию того, как именно мыслит математическая модель. А собранная личная коллекция удачных текстовых заготовок обязательно сэкономит время в будущем. Тем более, что освоенный навык создания цифровых шедевров гарантированно порадует домочадцев и удивит подписчиков в социальных сетях. Удачных вам нейрофотосессий и послушных алгоритмов!