Промт для паспорта (с примерами готовых промтов)

В сети представлено множество нейросетей, способных за пару секунд нарисовать хоть марсианский пейзаж, хоть портрет викторианской дамы. Однако, как только дело доходит до строгой бюрократической эстетики, искусственный интеллект начинает откровенно буксовать. Кажется, что машина просто не понимает концепцию скучного, стандартизированного изображения без художественных прикрас. И малейшая неточность в описании света или фона неминуемо превратит строгий документ в вычурную праздничную открытку. А если ещё вспомнить про жуткую асимметрию лиц, которой так грешат многие алгоритмы, кошелёк станет легче от постоянных платных перегенераций. И всё-таки грамотный подход к составлению текстовой команды творит настоящие чудеса. А начать стоит с понимания того, как именно цифровой мозг воспринимает официальный антураж.

Зачем вообще генерировать документы?

Сложная задача. Пиксель за пикселем алгоритм вырисовывает несуществующую голограмму на странице. Буквально десятилетие назад подобная детализация казалась фантастикой, но сейчас для геймдева или киноиндустрии такие махинации стали абсолютной обыденностью. Реквизит для съёмок или текстуры для видеоигр нужны постоянно. С одной стороны, можно нанять штатного реквизитора, с другой — дешевле поручить львиную долю рутины нейросети. Естественно, обыватель может задаться вопросом о легальности подобных картинок. Опасны ли такие цифровые эксперименты? Вовсе нет, если речь идёт о несуществующих странах или откровенно фейковых людях для дизайна. К слову, именно разработчики интерфейсов чаще всего грезят о качественных мокапах для своих презентаций. Настоящие личные данные использовать мы права не имеем. Это же просто здравый смысл. А вот правдоподобный фон для вымышленного персонажа создать стоит обязательно.

Анатомия запроса: базовые постулаты

Требования всегда остаются жёсткими. Иисус, философ или рок-звезда — алгоритму совершенно всё равно, кого именно сажать перед виртуальным объективом. Вся суть в том, что лицо обязано занимать ровно семьдесят процентов итогового кадра. Причём смотреть синтетический человек должен прямо в камеру. Загадочные ухмылки или томные взгляды стоит исключить сразу. К первой группе обязательных условий относится абсолютно нейтральное выражение лица. Далее в текстовую строку следует добавить упоминание чистого белого или светло-серого фона. Отдельно стоит упомянуть строгий запрет на тени за спиной объекта. Последним в списке идёт категорический отказ от очков, шарфов или массивных украшений. Разумеется, машина непременно попытается добавить изюминку в виде лишней блестящей серёжки. И творческие порывы нейронов отсекает только жёсткий негативный запрос. Впрочем, даже с ним добиться идеального результата довольно сложно.

Освещение

На эту важнейшую деталь новички внимания обычно не обращают. А зря.

Плохой свет — это всегда огромная ложка дёгтя в любой генерации.

Дело в том, что драматичные глубокие тени хороши для триллеров. А нам нужен откровенно скучный, плоский, добротный студийный свет. Спасательным кругом здесь станут термины из реальной профессиональной фотографии. Вполне рабочий вариант — прописать фронтальную кольцевую вспышку. К тому же отлично срабатывает упоминание двух софтбоксов по бокам. Безусловно, в строку команд стоит добавить слова о равномерном распределении яркости. Иначе одна половина лица неминуемо окажется в темноте. Выглядит впечатляюще на художественном портрете, но для официальных бумаг зрелище удручающее. Да и самим вычислительным мощностям гораздо проще работать без сложных градиентов.

Как выбрать нужный ракурс?

Пора перейти к конкретике. Как выглядит правильный текстовый приказ для создания портрета? Начинать запрос стоит с точного описания формата. Один из самых популярных видов запроса звучит примерно так: биометрическое фото на паспорт, крупный план лица европейского мужчины сорока лет, смотрящего прямо в объектив. Далее обязательно прописывается равномерное студийное освещение и отсутствие эмоций. Компактное решение для фона — просто указать чистый белый цвет без текстур. Следующий важный критерий касается самой виртуальной камеры. Например, отлично работает приписка о съёмке на объектив восемьдесят миллиметров с диафрагмой восемь. Это уберёт ненужное размытие заднего плана, сделав картинку резкой от края до края. В негативный промт (negative prompt) нужно вписать улыбку, очки, тени на фоне, зубы и любую наляпистость в одежде. Ну и, конечно же, облачиться ваш персонаж должен в тёмный костюм или строгую рубашку.

Разворот документа в объективе

Задача кардинально меняется. Человека мы больше не снимаем. Натюрморт, лежащий на деревянном столе, освещённый мягким дневным светом, дополненный лёгкой потёртостью страниц — вот наша новая цель. Сложно ли воссоздать текстуру плотной бумаги? Да, особенно если требуются сложные защитные элементы. В запрос настоятельно стоит включить упоминание микропечати и водяных знаков. Тем более, что именно она придаёт картинке нужную солидность. Нельзя не упомянуть и голографические символы, переливающиеся на свету. Конечно, нейросеть выдаст абсолютно нечитаемый текст, состоящий из случайных крючков. Но визуальный шум окажется крайне правдоподобным. Это надёжно. Потому что проверено. Временем и тысячами неудачных попыток. Пример запроса: открытый паспорт гражданина без опознавательных знаков, лежащий на столе, макросъёмка, глубина резкости, текстура защитной бумаги, голограмма в углу, реалистичное освещение из окна.

Какие ошибки всплывут первыми?

Многие обыватели считают генерацию минутным делом, но на самом деле подводные камни дают о себе знать практически сразу. Главная боль — асимметрия зрачков. Умный цифровой художник довольно часто рисует один глаз заметно больше другого. Зрелище, прямо скажем, жутковатое. Выручит здесь только скрупулёзный точечный ретуш. Буквально придётся брать лечащую кисть в графическом редакторе. К слову, вторая беда кроется в неестественной идеальности кожи. Пластиковая гладкая поверхность моментально бросается в глаза. Поэтому в промт стоит внедрять слова о порах и мелких мимических морщинках (freckles, skin pores, imperfections). Исконно человеческие несовершенства творят поистине грандиозные вещи с реализмом. Ведь идеальных людей в природе не существует. А если ещё вспомнить про странные воротники, анатомически сливающиеся с шеей, становится понятно: повозиться с настройками придётся.

Обложка паспорта: колоритный минимализм

Бордовая или тёмно-синяя плотная книжица с золотым тиснением. Кажется, что может быть проще для искусственного разума? Но алгоритм постоянно тяготеет к излишнему декору. Вместо строгого лаконичного герба на обложке солирует странная кракозябра, увенчанная десятком корон и крыльев. Чтобы избежать этого кошмара, фантазию машины нужно жёстко ограничивать. Минималистичный дизайн, золотое тиснение по центру, бордовая кожаная текстура — вот базис для запроса. Никаких лишних цветочных орнаментов. Разумеется, реальный государственный герб алгоритм не нарисует, его придётся дорабатывать вручную. Но как качественная болванка такой результат вполне сгодится. И не стоит перебарщивать с бликами на золотой фольге. Иначе бюджетный макет превратится в цыганское барокко.

Постпродакшен

Нет смысла переплачивать за идеальную платную генерацию, если базовые ошибки легко и непринуждённо исправляются руками. Не стоит ожидать от нейросети готового бланка с идеальными печатями и подписями. Лучше отказаться от затеи получить читаемый шрифт прямо из-под пера машины. Гораздо логичнее сгенерировать пустой, но реалистичный шаблон. А уже потом аккуратно вписать нужные данные стандартным системным шрифтом. Обе стороны медали важны: хорошая генерация и грамотный пост-продакшен всегда идут рука об руку. Тем более, что сейчас существует огромная масса инструментов для наложения правильного шума.

Текстовые заклинания для создания официальных бумаг всегда требуют колоссального терпения. Специфический внутренний лексикон машины каждому пользователю придётся осваивать методом проб и ошибок. Но каждый удачный, щепетильно выверенный кадр обязательно внесёт свою лепту в финальный проект. И не важно, собираете ли вы концепт для видеоигры или создаёте мудборд для кино. Пусть процесс настройки сложных параметров не вызывает раздражения, а итоговая сгенерированная картинка станет отличным решением для всех ваших творческих задач!