Промт для фото в стиле

В сети представлено множество готовых запросов, обещающих мгновенный шедевр в духе Ричарда Аведона или кинематографичной антиутопии. На практике же обыватель довольно часто получает пластиковую куклу, обильно политую цифровым глянцем. Ведь одно дело просто вписать имя знаменитого мастера, а совсем другое — заставить нейросеть прочувствовать зерно плёнки, фокусное расстояние и ту самую небрежную светотень. Специфика работы с генеративными моделями тяготеет к скрупулёзной настройке параметров, где каждое слово бьёт точно в цель или, наоборот, рушит всю композицию. Поэтому перед генерацией желательно разложить по полочкам саму анатомию стилизации.

Начинать с чего?

Светотень, прорисованная жёстким студийным рефлектором, ложится на скулы модели. Именно так строится добротный визуальный запрос — с освещения и текстуры. Обязательно ли сразу указывать конкретный жанр? Вовсе нет. Сначала стоит задать физические параметры кадра, отсекая нейросетевую вылизанность. К слову, львиная доля неудачных генераций связана с тем, что авторы напрочь забывают прописать тип камеры. Да и самим алгоритмам комфортнее опираться на технические маркеры. Взять, к примеру, классический портрет. Вместо банального описания внешности лучше использовать связку из формата носителя, усиленную указанием оптики, дополненную типом проявки. Это же правило касается и архитектурных пейзажей.

Стиль гранж в портрете

Выбор слов здесь очень большой. Но есть и минусы, ведь алгоритм часто скатывается в откровенную грязь вместо стильной небрежности. Эстетичны ли такие генерации? Зависит от точности формулировок. Начинать нужно с базы, прописывая рваные текстуры и приглушённую палитру.

Отличный пример рабочего запроса звучит примерно так: портрет уставшего музыканта в профиль, снятый на камеру с ISO 800, с выраженным хроматическим шумом, тусклый холодный свет из окна, эстетика Сиэтла девяностых годов.

Впрочем, не стоит забывать про маркер сырого изображения, добавляющий реализма. А если ещё вспомнить про правильный негативный промт, то результат действительно творит чудеса.

Аналоговая плёнка

Буквально десятилетие назад это было роскошью, но сейчас эмуляция физических носителей стала рутиной для нейрохудожников. Тем более, что современные сети прекрасно распознают маркеры конкретных эмульсий. К первой группе относится нестареющая классика вроде Kodak Portra 400, дающая тёплые скинтоны. Далее следует холодный и контрастный Fujifilm Superia, идеально подходящий для стрит-фотографии. Отдельно стоит упомянуть Ilford HP5 для создания глубокого, драматичного монохрома. Конечно, можно просто написать «чёрно-белое фото», однако тогда изюминка кадра бесследно исчезнет. Вся суть в том, что технические названия заставляют систему подтягивать из датасета вполне конкретный физический антураж.

Как выбрать оптику?

Широкоугольный объектив искажает перспективу. Это надёжно. Потому что проверено. Временем. И всё-таки для лиц лучше отказаться от фокусного расстояния меньше пятидесяти миллиметров. Дело в том, что короткий фокус вытягивает нос и ломает пропорции, что сразу бросается в глаза. Для создания эффекта подглядывания выручит длиннофокусная оптика (от 85 до 200 миллиметров), прописанная в тексте. Ну и, конечно же, не стоит перебарщивать с открытой диафрагмой. Разумеется, красивое размытие фона — это колоритный художественный приём. Но если указать значение f/1.2, машина может превратить в кашу даже уши модели, оставив резкими лишь глаза.

Фэшн-съёмка в студии

Сложно ли воссоздать атмосферу глянцевого журнала? Да, но результат того стоит. С одной стороны, достаточно вписать слово «мода», с другой — сеть часто утрирует наряды до состояния карикатуры. Многие считают, что имя известного бренда автоматически создаст изысканный образ, но на самом деле без указания схемы освещения магия не сработает. Чтобы получить добротный журнальный кадр, текст выстраивают последовательно. Сначала задают нейтральный фон, затем прописывают рисующий свет от октобокса, после чего добавляют текстуру ткани. Натыкаешься на такие запросы довольно часто: девушка в строгом костюме, жёсткие тени от жалюзи, кольцевая вспышка, эстетика девяностых. Обе стороны медали здесь в том, что малейшая ошибка в терминах превращает высокую моду в дешёвый каталог.

Вредно ли перегружать запрос?

Кошелёк станет легче, если постоянно тратить кредиты на махинации с полотнами текста в тысячу символов. В представлении многих длинный абзац гарантирует невероятную детализацию. Однако на практике лишние слова создают лишь смысловой шум. Сеть начинает путаться, пытаясь совместить несовместимое. К тому же вес каждого последующего слова неуклонно падает. Нельзя не упомянуть о правильном расставлении приоритетов. Главное достояние — лаконичность и чёткая структура. Лучше отказаться от десятка синонимов слова «красивый», заменив их одним точным определением эпохи. Всплывут ошибки быстро, если попытаться смешать акварель, киберпанк и гиперреализм в одном флаконе. Зрелище получается удручающее, напоминающее визуальную кашу.

Достопримечательности киберпанка: неоновые улицы

Неоновая вывеска, отражающаяся в луже на мокром асфальте, приковывает внимание. Для передачи масштаба футуристичных городов обычный лексикон не годится. Особый интерес вызывает использование терминов из профессиональной среды концепт-артистов. Во-первых, обязательно указывают дождь и туман, выравнивающие контраст сцены. Во-вторых, прописывают время суток для получения нужных бликов на металле. Ну и, наконец, добавляют материалы отделки, чтобы алгоритм понимал, как именно свет должен играть на поверхности кибернетических имплантов. Исконно правильный подход заключается в том, чтобы заставить машину рендерить атмосферу, а не саму геометрию. Ведь именно плотность воздуха имеет решающее значение в восприятии объёма.

Отдых в Токио: плёночная эстетика

Отпускные кадры часто страдают излишней искусственностью, если не внести лепту в виде правильных модификаторов. Когда-то тихое место сейчас превратилось в бурлящий мегаполис, и передать этот ритм довольно сложно. Спасательный круг кроется в использовании эффекта движения. Длительная выдержка (около одной секунды), прописанная в тексте, смазывает прохожих, оставляя главного героя в резкости. Дополняет образ плёнка Cinestill 800T, которая исторически использовалась для ночных съёмок в кино и даёт характерные красные ореолы вокруг источников света. Местный бомонд часто использует именно эту связку для создания самобытных уличных фотографий. Наляпистость исключается полностью, уступая место кинематографичному спокойствию.

Макромир

Требует ли съёмка мелких деталей особых постулатов? Безусловно. При попытке сгенерировать каплю росы на листе без указания макрообъектива, искусственный интеллект просто нарисует огромный лист. Решить проблему помогает точное указание масштаба и инструмента. Внушительный стеклянный объектив с макрокольцами, упомянутый в начале строки, сразу задаёт нужный вектор. Тем более, что фокусное расстояние в сто миллиметров идеально отделяет объект от фона. Кстати, не стоит забывать про освещение. Мягкий рассеянный свет от софтбокса выявит малейшие прожилки, тогда как прямая вспышка убьёт весь объём. Это тяжёлый, но эффективный способ заставить нейросеть мыслить категориями микроскопических величин.

Стоит ли описывать эмоции?

Лицо, искажённое гневом, всегда выглядит фальшиво на сгенерированных картинках. Нейросети плохо справляются со сложной мимикой, скатываясь в зловещую долину. Поэтому лучше отказаться от прямых указаний вроде «она сильно плачет» или «он истерически смеётся». Гораздо эффективнее описывать физиологические признаки эмоции. Слегка опущенные уголки губ, потупленный взгляд, напряжённые скулы передадут меланхолию куда тоньше. К тому же микровыражения лица, описанные через положение бровей, не ломают общую анатомию черепа. Естественно, такой подход требует наблюдательности, но именно он отличает скрупулёзный труд от ленивой генерации. Выручит глубокое понимание человеческой физиогномики.

Поэтому при составлении инструкций для нейронных сетей имеет смысл опираться на знания из реальной физики, изучая поведение фотонов и свойства стекла. Грамотно собранная текстовая конструкция обязательно порадует точным попаданием в нужную эстетику, а сам процесс создания изображений запомнится надолго.