В сети представлено множество потрясающих изображений, сгенерированных нейросетями, от фантастических пейзажей до фотореалистичных портретов. Многие пользователи, освоив базовые команды, пытаются пойти дальше и передать не просто внешность, а эмоцию, чувство, мимолётное состояние. И тут довольно часто натыкаешься на проблему «стеклянных глаз». Персонаж может быть красив, антураж – безупречен, но взгляд остаётся пустым, лишённым жизни. Удивительно, но ключ к живому взгляду лежит не в сложности модели (например, Midjourney или Stable Diffusion), а в искусстве составления правильного запроса.
Как научить нейросеть «любить» глазами?
С чего начинается работа над эмоцией? С понимания того, что для искусственного интеллекта абстрактные понятия вроде «любви» или «нежности» – это всего лишь статистические наборы данных, связанные с определёнными визуальными маркерами. Простой промт «man with a loving gaze» с высокой вероятностью выдаст вам человека со странной, немного жутковатой улыбкой и широко распахнутыми глазами. Дело в том, что машина пытается угодить, комбинируя самые очевидные признаки радости и внимания. Чтобы добиться глубины, нужно разложить это чувство на составляющие, понятные алгоритму. Вместо сухого приказания нейросети нужно подсказать, нарисовать для неё целую сцену, в которой этот самый влюблённый взгляд станет естественным и логичным следствием.
Нужно отметить, что львиная доля успеха кроется в детализации. Не стоит бояться длинных, описательных промтов. Чем больше конкретики вы дадите нейросети, тем меньше пространства для нежелательных импровизаций у неё останется.
Это же правило касается и стиля. Фотореализм потребует одних уточнений, а, скажем, аниме или цифровая живопись – совсем других. Поэтому перед тем, как бросаться в творческие махинациях, стоит чётко определить, какой именно результат вы хотите получить на выходе. Главное – не просто скомандовать, а направить машину, став для неё своего рода режиссёром-постановщиком цифровой сцены.
Детализация: что видит машина?
Задача не из лёгких. Ведь нужно разложить эфемерное чувство на конкретные составляющие, которые можно описать словами. Попробуем разложить этот процесс по полочкам, но не в виде скучного списка, а как последовательность шагов. Во-первых, стоит сфокусироваться на описании самого взгляда и микромимики. Вместо общего «loving gaze» используйте более точные эпитеты: «adoring gaze» (обожающий), «tender look» (нежный взгляд), «smitten expression» (сражённый любовью), «eyes full of warmth and affection» (глаза, полные тепла и нежности). К этому стоит добавить и сопутствующие детали: «soft smile» (мягкая улыбка), «slightly parted lips» (слегка приоткрытые губы), «head slightly tilted» (голова немного наклонена). Всё это – маркеры, которые ИИ считывает и ассоциирует с нужным состоянием.
Во-вторых, огромную роль играет контекст. Кто на кого смотрит? Взгляд, направленный на любимого человека, отличается от взгляда, которым мать смотрит на своего ребёнка. Поэтому в промте крайне желательно указывать объект этой любви. Например, «a man looks at his wife with adoration» (мужчина смотрит на жену с обожанием). Ну и, конечно же, антураж. Одно дело – взгляд при свечах в уютном ресторане, и совсем другое – на закате у моря. Окружение и освещение творят чудеса. Такие детали, как «soft warm lighting» (мягкое тёплое освещение), «golden hour» (золотой час), «bokeh background» (фон с боке), «cinematic light» (кинематографичный свет), не просто делают картинку красивее, но и помогают нейросети настроиться на нужный романтический лад.
Готовые промты: от нежности до страсти
Теория – это хорошо, но без практики она мертва. Давайте рассмотрим несколько готовых конструкций, которые можно взять за основу и адаптировать под свои задачи. Они помогут понять общую логику и послужат добротным стартом для ваших собственных экспериментов. Не стоит воспринимать их как нерушимые постулаты, скорее как проверенные рецепты, в которые всегда можно добавить свою изюминку.
Для создания атмосферы тихой, сокровенной нежности подойдёт довольно подробный запрос. Попробуйте что-то в духе: «Ultra-realistic photo of a young woman with a tender look on her face, her eyes are full of warmth and deep affection as she gazes at her beloved partner off-screen, soft natural morning light from the window, gentle smile, cozy bedroom setting, cinematic shot, 8k». Здесь мы задали всё: фотореализм, конкретное описание взгляда, источник света, место действия и даже технические параметры для высокого качества.
А если хочется добавить в изображение немного страсти и огня? Тогда и формулировки должны быть более экспрессивными. Например, можно использовать такой промт: «Cinematic portrait of a handsome man, his eyes burning with passionate love as he looks at his girlfriend, intense smitten expression, dimly lit romantic restaurant, candlelight flickering on his face, shallow depth of field, shot on film, photorealistic». Ключевые слова здесь – «burning with passionate love» (горящие страстной любовью) и «intense smitten expression» (напряжённое, сражённое любовью выражение). Они меняют тональность с нежной на более пылкую.
Отдельно стоит упомянуть взгляд, полный чистого обожания, почти благоговения. Это чувство передать сложнее всего. Здесь выручит следующий запрос: «Close-up portrait of a beautiful woman looking up at her husband, her face filled with pure adoration and awe, soft ethereal light, slight smile, tears of happiness welling in her eyes, highly detailed, emotional». Добавление «слёз счастья» (tears of happiness) – это мощный маркер для ИИ, который безошибочно указывает на пик эмоционального переживания. К слову, эти же принципы прекрасно работают и в других стилях, достаточно заменить «photo» на «digital painting» или «anime art style».
А что насчёт подводных камней?
Идеальных инструментов не бывает. Безусловно, в этой бочке мёда есть и своя ложка дёгтя. Даже с самым скрупулёзным промтом нейросеть иногда может выдать нечто странное. Самая частая проблема – это пересечение границы «зловещей долины», когда выражение лица становится слишком утрированным, неестественным и даже пугающим. Слишком широкая улыбка, чересчур распахнутые глаза – всё это побочные эффекты стараний машины. Что делать в таком случае? Во-первых, не стоит перегружать запрос взаимоисключающими эмоциями. Во-вторых, очень помогает использование негативных промтов (команд, указывающих, чего на изображении быть НЕ должно). Добавив в конец запроса что-то вроде «–no creepy, ugly, weird smile, scary», можно отсечь львиную долю неудачных генераций.
Кроме того, стоит помнить, что результат зависит и от случайности. Иногда для получения идеального изображения нужно сделать несколько попыток, меняя незначительные детали в запросе или просто генерируя варианты с одним и тем же текстом. Это не сложный, но довольно кропотливый процесс, требующий терпения. Не забудьте, что разные модели ИИ по-разному интерпретируют одни и те же слова. Промт, который творит чудеса в Midjourney, может дать посредственный результат в Stable Diffusion, и наоборот. Это две стороны одной медали: с одной стороны – безграничные возможности, с другой – необходимость постоянной адаптации.
Главное – не бояться экспериментов, пробовать разные сочетания и формулировки. И тогда магия обязательно случится, а на сгенерированном портрете вы увидите не просто пиксели, а настоящую историю любви. Удачи в ваших творческих махинациях!