Промт для селфи

В сети можно найти бесконечное количество красивых сгенерированных портретов, где каждая ресничка прорисована с пугающей реалистичностью. Многим кажется, что достаточно вбить пару базовых слов, и алгоритм мгновенно выдаст живой автопортрет. Устав от суеты с многочасовой настройкой узлов в ComfyUI, обыватель часто пытается решить задачу наскоком, но на самом деле именно специфика фронтальной камеры смартфона требует самого скрупулёзного подхода. Ведь львиная доля брака оседает в мусорной корзине именно из-за неестественной геометрии лица или слишком уж идеальной, пластиковой кожи. Поэтому перед запуском генерации желательно разложить по полочкам саму логику построения такого специфического запроса.

Оптические искажения

Начать нужно с объектива. Буквально десятилетие назад фронтальные камеры телефонов выдавали шумную картинку низкого разрешения, но сейчас современные алгоритмы пытаются нарисовать идеальную студийную фотографию даже там, где она не нужна. А живой кадр требует искажений. Разумеется, добротный современный аппарат даёт узнаваемую перспективу вытянутой руки. Чтобы её воссоздать, первый блок токенов стоит посвятить техническим параметрам. Написав текстовую конструкцию, включающую упоминание селфи-камеры, дополненную указанием на фокусное расстояние в восемнадцать миллиметров, приправленную тегом сырого формата фотографии, мы задаём правильный вектор для нейросети. К слову, именно такая связка творит чудеса. Иначе вместо спонтанного снимка вылезет скучная академическая постановка, которая сразу бросается в глаза. Сложно ли имитировать лёгкую небрежность? Довольно тяжело. Но добавление слов вроде «любительская съёмка» или «снимок на телефон» выступает в роли того самого якоря, удерживающего композицию от ухода в профессиональный глянец.

Как выстроить освещение?

Свет льётся рекой на коммерческих рендерах. Однако для нашего формата излишняя вылизанность бликов лишь испортит исконно бытовую атмосферу. Не стоит перебарщивать с профессиональными терминами вроде софтбокса или контрового контрового света. Дело в том, что машинный разум тяготеет к рекламной эстетике. Естественно, живое освещение имеет свои изъяны. Отличным вариантом станет имитация жёсткого солнца или тусклой лампы накаливания в коридоре. К первой группе относится мягкий рассеянный свет от окна в пасмурный день. Далее следует упомянуть резкие тени от листвы, падающие на щёки. Отдельно стоит упомянуть кольцевую лампу, которая даёт характерный круглый блик в зрачках. Последним в списке идёт спасательный круг для тёмных сцен — прямая вспышка смартфона в лоб. Безусловно, здесь таятся свои подводные камни. Вспышка безжалостно выявляет текстуру кожи, да и лицо делает плоским. Тем более, что алгоритм может дорисовать эффект красных глаз. И всё-таки именно такой свет выглядит максимально убедительно.

Повседневная эстетика: рабочие примеры

Теория без практики мертва. Это очевидно. Ведь голые постулаты не помогут получить картинку. Рассмотрим процесс сборки запроса. Во-первых, прописываем субъекта, избегая слов о невероятной красоте. Во-вторых, добавляем действие, указывая, что персонаж держит смартфон одной рукой и смотрит прямо в объектив. Ну и, наконец, накидываем параметры окружения.

Запрос может выглядеть довольно просто: уставший парень в мятой футболке делает селфи в лифте, тусклый флуоресцентный свет, отражение в грязном зеркале, зернистость плёнки.

Нужно отметить, что негативный промт здесь играет не менее важную роль. Лучше отказаться от слов вроде «симметрия», «3D-рендер» или «профессиональная ретушь». Откажитесь от чрезмерного сглаживания. Идеально гладкие лица грезят на страницах журналов, а нам нужна жизнь. Лёгкая асимметрия бровей или растрёпанные волосы внесут свою лепту в создание эффекта подлинности. Кошелёк станет легче на пару кредитов генерации, но результат того стоит.

Улицы Токио: неоновый антураж

Японская столица всегда манила художников своей атмосферой. Отражения в мокрых лужах, переплетение проводов, бесконечные светящиеся иероглифы. Когда-то создание такого сложного фона требовало долгих часов кропотливого труда, но сейчас генеративные модели собирают этот колоритный пазл за секунды. Однако машинные махинации с перспективой иногда дают сбои, превращая задник в кашу. Чтобы фон не поглотил главного героя, солирует в кадре всё равно лицо, а город лишь выступает декорацией. Впрочем, детализировать среду всё же стоит. Сначала описываем девушку, облачиться которой пришлось в прозрачный дождевик. Затем добавляем сам процесс съёмки себя на камеру. И уже потом вплетаем детальное описание перекрёстка Сибуя под проливным дождём, где размытые огни неоновых вывесок создают цветные блики на мокрой коже. Это же правило касается любых других локаций. Кстати, если упустить детализацию глубины резкости, наляпистость заднего плана уничтожит объём. Вычурный фон просто сольётся с фигурой.

Скрытые анатомические дефекты

Шесть пальцев на руке. Знакомая картина. Именно с конечностями дело обстоит сложнее всего. Держащая гаджет кисть часто превращается в жуткое месиво из лишних фаланг, и это серьёзно бьёт по бюджету времени, выделенного на проект. Обязательно ли мириться с этим? Вовсе нет. Не скупитесь на уточнения позиции пальцев в текстовом блоке. Серьёзное вложение усилий в описание хвата (например, указательный палец на кнопке громкости) помогает модели понять анатомию. Хотя и это не даёт стопроцентной гарантии. Очередная ложка дёгтя всплывёт при генерации фактуры эпидермиса. Настоящий кладезь реализма — это поры, веснушки, мелкие морщинки и пушок на щеках. Снабдив запрос терминами, описывающими несовершенства кожи, усилив их параметрами резкости, мы получим поистине внушительный портрет. Да и сама нейросеть лучше справляется с деталями, когда ей явно указывают на наличие микродефектов.

Стоит ли добавлять стилизацию?

Вопрос не праздный. Многие энтузиасты любят смешивать эпохи, создавая грандиозный визуальный винегрет. В представлении новичков обилие тегов художников делает картинку богаче. Но есть и минусы. Самобытный стиль автора конфликтует с жанром автопортрета. Попытка скрестить масляную живопись с мобильной фотографией обычно приводит к тому, что результат выглядит неоднозначный. Обе стороны медали нужно учитывать. Если цель — сюрреализм, то эксперименты приветствуются. А вот добавление слов «кинематографичный» или «плёночная фотография девяностых» кардинально меняет настроение в нужную сторону. Плёнка даёт характерное зерно. Это атмосферно. Потому что знакомо. С детства. Кроме того, цифровой бомонд сейчас активно использует эстетику старых мыльниц или камер видеонаблюдения. Такой изысканный подход позволяет скрыть мелкие огрехи генерации под слоем шума и хроматических аберраций.

Ткани и фактуры: щепетильный подбор

Смазанный край воротника. Зачастую именно на одежде алгоритм расслабляется, выдавая мыльные текстуры без логичного кроя. Чтобы герой уверенно стоял на ногах в плане визуальной достоверности, одежду нужно прописывать так же тщательно, как и лицо. Не перегружайте запрос брендами, лучше сосредоточьтесь на материалах. Вязаный свитер крупной вязки, потёртая джинсовая куртка, льняная рубашка с заломами. Ткань должна иметь плотность. К тому же, если на фото присутствует чадо в яркой одежде с пайетками, нейросеть может запутаться в бликах. Поэтому сложные паттерны (вроде мелкой клетки) стоит использовать с осторожностью. Главное — фактура. Натыкаешься взглядом на пуговицу, а она реалистично отражает свет. Именно такие нюансы отличают шедевр от посредственности.

Формат и геометрия

Вертикальный кадр. Задача понятная. Нет смысла генерировать квадратные изображения, если мы имитируем снимок с телефона. Выставив соотношение сторон девять к шестнадцати, мы сразу задаём правильные рамки. А вот с кадрированием регулярно возникают сложности. Алгоритм обожает обрезать макушку или, наоборот, оставлять пустую стену над головой. Решается эта проблема добавлением параметров среднего или крупного плана. Заслуживает истинного уважения тот автор, который прописывает угол наклона камеры. Ведь селфи снизу вверх (чтобы казаться выше) или сверху вниз (для акцента на глазах) — это совершенно разные визуальные истории. Да и искажения лица при этом меняются кардинально.

Поиск идеальной текстовой формулы напоминает алхимию, где каждое новое слово может внести неожиданные коррективы в итоговое полотно. Балансируя между технической сухостью описания оптики и художественным хаосом повседневной жизни, можно добиться феноменальных результатов. Удачи в бесконечных экспериментах, пусть каждый ваш новый запрос трансформируется в шедевр, который гарантированно порадует живой эстетикой и запомнится надолго!