Промты для совместных фото (с примерами готовых промтов)

В сети представлено множество восхитительных изображений, сгенерированных нейросетями, где люди выглядят пугающе реалистично. Однако каждый, кто хоть раз пытался создать картинку с двумя или тремя персонажами, непременно натыкался на жуткие мутации: сросшиеся тела, лишние конечности или лица, слившиеся в единую бесформенную массу. Плохой результат — это не всегда вина самого алгоритма. Чаще всего проблема кроется в непонимании того, как машина интерпретирует текстовые запросы при работе с несколькими объектами. Но чтобы не ошибиться и получить действительно добротный кадр, нужно кардинально пересмотреть подход к написанию инструкций для искусственного интеллекта.

Почему алгоритмы путают людей?

Сложно ли заставить машину нарисовать двух разных личностей? Да, и задача эта крайне щепетильная. Зрелище удручающее. Ведь нейросеть по своей природе тяготеет к усреднению концепций. Дело в том, что при запросе «мужчина и женщина» математическое пространство часто смешивает их признаки, выдавая женщину с бородой или мужчину с ярким макияжем. Чтобы избежать подобных казусов, стоит разложить по полочкам каждую деталь. К первой группе хитростей относится чёткое разделение одежды через цветовые маркеры. Далее следует жёсткое позиционирование в кадре (кто стоит слева, кто справа). Ну и, наконец, спасательный круг — использование параметров веса для каждого отдельного слова.

Романтика в кадре: Парные портреты

Прямо поверх объектива падают крупные хлопья снега, пока двое влюблённых смотрят друг на друга. Именно с такой визуализации начинается магия. В представлении многих обывателей достаточно написать «красивая пара», но на самом деле такой подход бьёт по качеству результата. Особый интерес вызывает метод детального нарратива. К слову, один из самых популярных видов запроса звучит так:

«Кинематографичный кадр, снятый на плёнку тридцать пять миллиметров, мужчина в строгом чёрном пальто стоит слева, а справа от него улыбающаяся женщина в красном бархатном платье, они держатся за руки в заснеженном парке, мягкий вечерний свет льётся рекой».

Выглядит впечатляюще. И всё же не стоит забывать о негативных промтах. Откажитесь от коротких фраз в пользу подробного описания атмосферы.

Сложно ли стилизовать эпоху?

Многие считают, что ретро-фотографии получаются у машин хуже всего, но на самом деле винтажный антураж скрывает большинство графических артефактов. Буквально пару лет назад генерация исторических костюмов превращалась в сущий кошмар, однако сейчас ситуация изменилась в лучшую сторону. Тем более, что старые объективы дают естественное размытие. А вот отличный пример готового текста:

«Чёрно-белое уличное фото тысяча девятьсот двадцатого года, колоритный джентльмен в твидовом костюме и шляпе курит сигару, рядом с ним элегантная дама в жемчужном ожерелье, зернистость плёнки, высокая контрастность теней».

Разумеется, здесь солирует именно текстура старой бумаги.

Семейные архивы

Задача не из лёгких. Собрать в одном кадре родителей и чадо так, чтобы никто не обзавёлся третьей ногой, довольно сложно. Вся суть в том, что увеличение количества лиц экспоненциально увеличивает риск ошибки. С одной стороны, хочется добавить больше деталей, с другой — излишняя наляпистость путает процессор. Выручит строгая композиция, выстроенная через творительный падеж. Например, попробуйте такой вариант:

«Семья из трёх человек, сидящая на зелёном газоне, освещённая ярким полуденным солнцем, одетая в белые льняные рубашки, где отец обнимает мать, а маленький мальчик с русыми волосами играет с золотистым ретривером на переднем плане».

Безусловно, здесь тоже есть свои подводные камни. Довольно часто алгоритм пытается сделать лица детей похожими на уменьшенные копии взрослых лиц.

Съёмка в Милане: Уличная мода

Глянцевый бомонд всегда вызывает восхищение. Искусственный интеллект обожает моду, поскольку обучен на миллионах профессиональных лукбуков. Главное — угадать с палитрой. Не скупитесь на упоминание брендов или конкретных тканей, ведь именно они задают тон всей картинке. Чтобы персонажи выглядели как модели, стоит внести лепту в описание освещения. К примеру:

«Две девушки-модели идут по брусчатке на фоне готического собора, первая девушка облачена в изысканный изумрудный тренч, вторая демонстрирует вычурный кожаный жакет, студийный свет, блики на мокром асфальте, фотореализм».

Естественно, такой самобытный запрос практически всегда выдаёт отличный результат с первого раза.

Техническая отладка

Обязательно ли использовать параметры соотношения сторон? Вовсе нет, но без них кадр может получиться слишком тесным. А если ещё вспомнить про махинации с сидами (уникальными номерами генерации), то голова может пойти кругом. С генерацией рук дело обстоит сложнее всего. Львиная доля брака оседает именно в области пальцев. Поэтому в негативный промт (то, чего не должно быть на фото) обязательно нужно вписывать слова:

«лишние пальцы, мутация анатомии, сросшиеся конечности, размытые лица».

Это надёжно. Потому что проверено. Опытом тысяч пользователей. Исконно проблемными зонами также остаются глаза при общих планах.

Стоит ли использовать референсы?

Когда-то загрузка собственного фото для основы была редкостью, сейчас же это базовый функционал. Изображение, дополненное текстовым запросом, усиленное правильным весом параметров, выдаёт грандиозный результат. Однако здесь всплывут новые нюансы. Если исходное фото имеет плохое качество, нейросеть заботливо перенесёт весь этот цифровой шум на финальный рендер. Ложка дёгтя в этой бочке мёда — потеря сходства при сильной стилизации. Не перегружайте алгоритм противоречивыми команды. Если вы хотите реализм, лучше отказаться от слов вроде «фантастический» или «магический».

Коммерческий подход

Серьёзное вложение времени в изучение промтов в итоге окупается сполна. Платные подписки на передовые нейросети, конечно, бьют по бюджету, но бесплатные аналоги редко способны вытянуть сложную сцену с тремя и более персонажами. Кошелёк станет легче, однако взамен вы получите настоящий кладезь возможностей. Обе стороны медали очевидны: вы платите за стабильность. Процесс не сложный, но кропотливый. Ведь чтобы персонаж твёрдо стоял на ногах, а не парил над землёй, иногда приходится сделать десяток попыток. Впрочем, результат того однозначно стоит.

Финальные штрихи

Любая совместная фотография — это история про взаимодействие. Если персонажи просто смотрят в камеру, кадр выглядит искусственно. Добавьте в промт действие: «смотрят друг на друга», «шепчутся», «смеются над шуткой». Динамика творит чудеса. Удивительно, но даже лёгкий наклон головы, прописанный в тексте, кардинально меняет восприятие картинки. Попробуйте сгенерировать такой сюжет:

«Трое друзей сидят у ночного костра в лесу, жарят зефир, тёплый ламповый свет падает на их улыбающиеся лица, на заднем фоне виднеется тёмный силуэт гор, гипердетализация».

Удачи в экспериментах с освещением, пусть каждая новая генерация радует вас безупречной анатомией и потрясающей атмосферой.