Промты для фото лица

В сети представлено множество сгенерированных портретов, где пластиковые куклы с мёртвыми глазами выдаются за вершину цифрового искусства. Кажется, нет ничего проще, чем вбить пару слов в строку ввода, однако на практике львиная доля таких картинок годится разве что для мусорной корзины. Ведь нейросети неизбежно тяготеют к усреднённым идеалам, старательно затирая любые изъяны и превращая живого человека в бездушный манекен. В представлении многих достаточно написать «красивая девушка», и машина выдаст шедевр, но на деле такие базовые запросы генерируют лишь визуальный мусор. Поэтому перед отправкой задачи алгоритму желательно скрупулёзно продумать каждый токен, собирая текстовую конструкцию по крупицам.

Как выбрать объектив?

Пятьдесят миллиметров. Именно такое фокусное расстояние чаще всего диктует алгоритмам самую естественную геометрию человеческого черепа. Безусловно, можно экспериментировать с шириком, получая забавные искажения, однако классический портретный объектив всегда творит чудеса. И всё же обыватель довольно часто игнорирует оптические параметры, надеясь на встроенные пресеты. А зря. Ведь простая приписка «shot on 85mm lens» моментально меняет глубину резкости, вытягивая объект на передний план и мягко размывая задник. Нужно отметить, что именно фокусное расстояние задаёт тот самый профессиональный антураж, за которым так гонятся многие цифровые творцы. К тому же добавление конкретной модели камеры (например, Sony A7R IV) заставляет алгоритм имитировать матрицу этого изысканного современного аппарата.

Освещение

Специфика света меняет абсолютно всё. Натыкаешься порой на колоритный самобытный портрет и понимаешь: здесь солирует именно грамотно выставленный студийный свет. Стоит отметить, что банальные запросы вроде «good lighting» работают отвратительно, выдавая плоскую и невыразительную картинку. На самом деле лучше отказаться от обобщений в пользу технической конкретики. Попробуйте прописать «Rembrandt lighting, rim light, softbox», и лицо сразу же обретёт объём. Дело в том, что алгоритм обучался на тысячах профессиональных фотографий, где эти термины имели чёткую визуальную привязку к физике света. Ну и, конечно же, не стоит забывать про «catchlight» — те самые крошечные блики в глазах, без которых взгляд сгенерированного персонажа кажется стеклянным. Венчает композицию боковой свет, который превосходно подчёркивает текстуру кожи.

Детализация кожи

Обязательно ли прописывать поры и морщины? Вовсе нет, если конечной целью выступает глянцевая журнальная обложка с идеальной ретушью. Однако для достижения гиперреализма эта щепетильная работа с текстом просто необходима. Буквально десятилетие назад о такой степени контроля над 3D-моделями художники могли только мечтать, но сейчас достаточно вписать «skin pores, peach fuzz, subtle blemishes, uneven skin tone». Разумеется, нейросеть может переборщить, выдав зрелище удручающее и пугающее. Поэтому не стоит перегружать запрос десятками медицинских терминов, превращая лицо в пособие по дерматологии. Выручит аккуратный баланс, где фраза «highly detailed skin» комбинируется с лёгкими несовершенствами. Это серьёзное вложение в финальное качество генерации, которое совершенно не сильно ударит по кошельку, если вы арендуете облачные мощности с почасовой оплатой.

Стоит ли усложнять?

Задача не из лёгких. Многие считают, что чем длиннее текст, тем качественнее получится результат, но на самом деле обе стороны медали имеют свои изъяны. Слишком раздутый запрос сбивает систему с толку, заставляя её путаться в приоритетах. Наляпистость из сотен тегов приводит к тому, что генератор начинает игнорировать важные детали, концентрируясь на второстепенном шуме. Впрочем, и короткие фразы таят в себе подводные камни, оставляя слишком много пространства для фантазии искусственного интеллекта. Если ограничиться только базовым описанием, то неминуемо всплывут ошибки в виде лишних зубов или странных пропорций носа. Настоящий спасательный круг в такой ситуации — это грамотно структурированный промт. Во-первых, описываем сам объект и его эмоции, во-вторых, указываем технические параметры съёмки, ну и, наконец, добавляем стилистические фильтры.

Этническая принадлежность: нюансы

А вот здесь начинается самое интересное пространство для экспериментов. Генотип сильно влияет на геометрию лица, однако базовые модели часто скатываются в скучный европоцентризм. Чтобы разорвать этот шаблон, придётся внести лепту в виде точных антропологических маркеров. Естественно, простые указания вроде «Asian» или «African» сработают, но они дадут усреднённый, пластиковый результат. Стоит задуматься о более точных географических привязках, уходя в глубокую детализацию. Например, фразы «Han Chinese woman» или «Ethiopian man» выдадут куда более живой, настоящий типаж. К слову, смешение кровей в промте (допустим, «half-Japanese half-Scandinavian») часто генерирует поразительной красоты лица, приковывая внимание зрителя своей нестандартностью. Ведь именно такие неочевидные комбинации вызывают восторг и заставляют поверить, что перед нами настоящий человек.

Возраст и эмоции

Возраст творит чудеса с фактурой кадра. Машинный разум обучен на миллионах фотографий молодых идеальных людей, поэтому старики у него часто получаются как юные модели с искусственно нарисованными морщинами. Чтобы избежать этого диссонанса, в дело вступают базовые постулаты описания жизненного опыта. В представлении новичка достаточно написать «old», но куда эффективнее работают связки «65 years old, deep wrinkles, sagging skin, weathered face». Это же правило касается и передачи настроения. Широкая улыбка обнажает зубы, с которыми у нейросетей исторически складываются довольно сложные отношения. Поэтому лучше отказаться от открытой радости в пользу «subtle smile, melancholic gaze, slightly parted lips». Да и самим алгоритмам гораздо комфортнее отрисовывать спокойные состояния, где нет сложной геометрии напряжённых мимических мышц. Внимание зрителя оседает именно на таких тихих, задумчивых портретах.

Отрицательные промты

Уборка мусора. Именно так можно охарактеризовать работу с негативными запросами. И всё же некоторые пользователи до сих пор пренебрегают этим мощнейшим инструментом. А ведь он работает как строгий санитарный контроль, безжалостно вычищая из кадра мыло, пересветы и жуткие мутации. Внести в этот блок слова «3d, render, smooth, plastic, ugly, deformed» стоит обязательно каждому, кто хочет получить фотографическое качество. Тем более, что добавление этих слов занимает считанные секунды, а экономит массу времени на бесконечных перегенерациях. Кроме того, сюда же без сожалений отправляются «watermark» и «text». Вся суть в том, что алгоритм часто воспринимает водяной знак как неотъемлемый атрибут хорошей стоковой фотографии и заботливо лепит его прямо на лоб модели.

Цветокоррекция

Плёнкой Kodak Portra 400, обработанной в прохладных тонах, пропитанной зернистостью, создаётся та самая атмосфера лёгкой ностальгии. Цветовая палитра напрямую зависит от указанных фотоматериалов, которые вы впишете в строку ввода. Конечно, можно просто написать «cinematic color grading», однако профессиональный бомонд предпочитает указывать конкретные типы плёнки. Например, Fujifilm Superia 400 даёт характерные зеленоватые тени, а Ilford HP5 обеспечивает глубокий, контрастный монохром. Само собой, это добавляет снимку внушительный исторический бэкграунд. Когда-то давно увлечение аналоговой фотографией считалось уделом избранных, но сейчас это превратилось в кладезь готовых решений для нейросетей. Нельзя не упомянуть, что добавление короткой фразы «film grain» окончательно убивает любую искусственную гладкость.

Что насчёт стилизации?

Сложно ли уйти от сухого фотореализма? Да, процесс требует терпения, но результат всегда окупает затраченные усилия. Иногда у автора возникает потребность облачиться в вычурный арт-стиль, на время забыв про объективы и диафрагмы. Здесь на помощь приходят имена конкретных художников и названия традиционных техник. Если написать «oil painting by John Singer Sargent, thick impasto brushstrokes», то цифровое лицо обретёт живописную фактуру, где каждый мазок ложится точно по форме скул. Кстати, подобные махинации с текстом требуют от создателя определённой насмотренности. Ведь алгоритм не просто бездумно копирует стиль, он синтезирует его с заданными чертами лица. Главная изюминка такого подхода заключается в поиске неочевидных сочетаний, которые до вас никто не пробовал. Однако не стоит смешивать слишком много разных направлений в одном котле. Иначе на выходе получится абсолютно неоднозначный визуальный винегрет, который бросается в глаза своей тотальной нелепостью.

Одежда и фон

Сгенерированное чадо алгоритма не висит в пустоте. Выбор гардероба и заднего плана играет колоссальную роль в восприятии портрета, формируя контекст истории. Если оставить фон на откуп нейросети, она с высокой долей вероятности размажет за спиной модели скучное серое пятно или банальный пейзаж. Поэтому стоит окунуться в детализацию окружения, прописав «busy neon street background, out of focus» или «dimly lit jazz club». Одежда же помогает закрепить выбранную эпоху и социальный статус персонажа. Фразы вроде «turtleneck sweater, textured wool» или «vintage leather jacket» добавляют в кадр необходимую тактильность. Тем более, разные ткани по-разному отражают свет, что делает картинку ещё более достоверной. Кошелёк станет легче от покупки платных кредитов, если вы будете генерировать вслепую, надеясь на случайное везение генератора.

Взаимодействие человека и машины требует тонкого понимания механик, стоящих за текстовыми описаниями. Не бойтесь перекраивать свои привычные запросы, удаляя заезженные формулировки и добавляя свежие, нестандартные детали. Тщательно подобранная оптика, выверенный свет и правильная текстура кожи способны вытянуть любой замысел из глубин математических вычислений в осязаемую реальность. Пусть каждый новый сгенерированный кадр впечатляет своей глубиной и запомнится надолго.