Промт для фото со знаменитостью

В сети представлено множество сгенерированных изображений, где обычные люди непринуждённо пьют кофе с голливудскими звёздами, обнимаются с известными музыкантами или позируют на красных дорожках рядом с мировым бомондом. Буквально десятилетие назад подобная качественная подделка требовала скрупулёзной многочасовой работы в графических редакторах, а сейчас продвинутые нейросети выдают реалистичные кадры за три миллисекунды. И всё же обыватель довольно часто сталкивается с проблемой эффекта «зловещей долины», когда лицо кумира выглядит пластиковым, а кожа напоминает идеально отполированный манекен. Но чтобы не ошибиться и получить по-настоящему живой кадр, нужно выстроить предельно точную текстовую конструкцию, учитывая физику света и геометрию кадра.

Ваш личный ИИ-отдел маркетинга, который работает 24/7 📈

Ускорьте создание контента в 10 раз! Этот мульти-ИИ сервис позволяет писать безупречные продающие посты, генерировать уникальные фото для соцсетей, создавать рекламные промо-ролики с нуля и писать для них музыку в пару кликов. Идеальное решение для предпринимателей, маркетологов и SMM-специалистов. Всё в едином удобном интерфейсе — больше не нужно переключаться между десятком вкладок.

Делегируйте рутину искусственному интеллекту и увеличивайте продажи. Начните работу здесь 👉 https://clck.ru/3RNCRL

Архитектура запроса

Текст решает всё. В основе качественной генерации лежит грамотная последовательность токенов, выстроенная по принципу от общего к частному. Начинать нужно с чёткого определения формата, задавая базовые параметры съёмки. Сперва прописывается тип изображения, далее следует указание конкретных персон, к третьей группе относится описание их действий, ну и, наконец, венчает эту конструкцию детализация окружения. К слову, многие новички совершают ошибку, вписывая имя знаменитости в самый конец строки. Дело в том, что текстовые энкодеры постепенно теряют внимание к концу запроса. Поэтому самые важные элементы стоит всегда выносить в начало. А вот оригинальное имя звезды желательно брать в скобки, повышая вес токена до оптимальных значений (обычно от 1.1 до 1.3), чтобы нейросеть не размыла знакомые черты.

Как добиться фотографической точности?

Сложно ли сымитировать реальный снимок объектива? Вполне осуществимо, если перестать использовать абстрактные слова вроде «красиво» или «реалистично». Настоящий кладезь для опытного промпт-инженера кроется в технических терминах из мира фотографии. Кадры, созданные с упоминанием плёнки Kodak Portra 400 или Fujifilm Superia, приобретают самобытный колоритный оттенок. И всё-таки львиная доля успеха зависит от правильного фокусного расстояния. Оптимальным решением для портретов станет объектив 85mm. Ведь именно он имеет свойство правильно передавать пропорции лица без искажений. К тому же не стоит забывать про диафрагму. Упоминание f/1.8 или f/2.8 гарантированно размоет задний фон, создав красивое боке, которое приковывает внимание исключительно к лицам героев.

Освещение в кадре: Анатомия света

Идеальный студийный свет часто выдаёт искусственное происхождение картинки с головой. Зрелище удручающее, когда на улице ночь, а лица персонажей освещены так, словно они находятся в операционной. Настоящая изюминка кроется в естественных несовершенствах. Естественно, куда лучше работает контровой свет от заходящего солнца, прорисовывающий силуэты, или холодный неоновый отблеск, падающий сбоку. Приглушённый тёплый свет творит чудеса, скрывая мелкие артефакты генерации. Нужно отметить, что объёмная картинка получается при использовании термина «Rembrandt lighting». Это надёжно. Потому что проверено. Годами практики. Да и самим персонажам в кадре такой драматичный рисунок теней добавляет глубокой человечности.

Взаимодействие в кадре: Анатомия объятий

Прямо в центре композиции переплетаются руки, превращаясь в бесформенную массу плоти. Это неизбежно, если пустить процесс на самотёк.

Геометрия тесного физического контакта — это тяжёлый, но решаемый вопрос для современных моделей.

Конечно, можно просто написать слово «hugging», однако ложка дёгтя обязательно проявится в виде лишних пальцев. Лучше отказаться от сложных переплетений кистей. Безусловно, безопаснее ставить героев рядом, соприкасаясь плечами, или прямо указывать, что руки спрятаны в карманы. Если же в кадре солирует конкретная знаменитость, обнимающая вас за плечи, стоит применять инструменты вроде ControlNet. Тем более, что этот плагин позволяет разложить по полочкам анатомию каждого персонажа через жёсткий референс скелета.

Вредно ли перегружать контекст деталями?

Обилие мелких объектов на заднем плане часто бьёт по бюджету внимания алгоритма. С одной стороны хочется показать грандиозный антураж вечернего Парижа или роскошную яхту, с другой — наляпистость фона путает нейросеть. Вся суть в том, что ресурсы модели ограничены. Довольно часто натыкаешься на генерации, где вместо чёткого лица Ди Каприо или Илона Маска мы видим лишь смутно похожего двойника, потому что алгоритм потратил все силы на прорисовку кирпичной кладки на фоне. Не перегружайте сцену. Откажитесь от перечисления всех предметов мебели в комнате. Главное — угадать с палитрой. Выручит короткое, но ёмкое описание атмосферы.

Стилистика одежды: Базовый гардероб

Что насчёт фасона? Лучший вариант кроется в простоте повседневных вещей. Светский бомонд грезят увидеть в повседневной обстановке, поэтому строгие костюмы лучше оставить для официальных постеров. Белая базовая футболка, потёртая кожаная куртка, накинутая на плечи, сшитая из грубого материала, дополненная простыми джинсами — вот идеальный рецепт. Исторические костюмы требуют отдельного подхода. Фотография, сделанная на мокрый коллодион, проявленная в реактивах, покрытая сепией, задаст правильный тон для встреч с личностями из прошлого века. А если ещё вспомнить, что вычурный исторический наряд требует соответствующих декораций, то процесс усложняется вдвое. Не стоит гнаться за сложными платьями от кутюр, если ваша цель — создать доверительный, дружеский кадр.

Стоит ли экономить на негативном промте?

Спасательный круг любой генерации часто недооценивают. В представлении многих достаточно вписать слово «bad» десяток раз, чтобы алгоритм всё понял. Вовсе нет. Махинации с отрицательными весами требуют скрупулёзного подхода. Когда-то давно люди писали целые поэмы в негативных полях, но сейчас слишком длинный текст там скорее вредит. Внести лепту в чистоту кадра поможет отсечение 3D-рендеров, пластиковой кожи и неестественной симметрии. Один из самых популярных видов мусора отсекается словом «cgi», далее следует блокировка «smooth skin», за ней идёт запрет на «illustration», последним в списке идёт «oversaturated». И всё же, базовые модели нуждаются в профилактике (пару раз за сессию), поэтому стоит держать под рукой заранее заготовленный шаблон негативного запроса.

Пост-обработка

Лицо знаменитости на готовом снимке может немного отличаться от оригинала. Это нормально. Ведь алгоритм усредняет черты множества фотографий из обучающей выборки. Настоящие профессионалы никогда не останавливаются на сыром результате. Выручит точечный Inpainting. Процесс не сложный, но кропотливый. Выделяете лицо маской, снижаете параметр Denoising strength до значения 0.25 или 0.3 и генерируете заново. Не скупитесь на время, потраченное на перебор сидов. Лёгкий деликатный апскейл сохранит индивидуальные морщинки звезды, не превратив её в восковую куклу. Подводные камни кроются именно в чрезмерном сглаживании на этапе увеличения разрешения. Кошелёк станет легче, если вы будете тратить токены платных сервисов на бездумный апскейл всего подряд.

Тонкая настройка эмоций

Улыбка в тридцать два зуба часто выглядит пугающе на сгенерированных фото. Разумеется, алгоритмы тяготеют к гипертрофированным радостным выражениям лиц, если в промте есть слово «happy». Замените его на «subtle smile», «relaxed face» или «candid moment». Эти постулаты работают безотказно. Лёгкая задумчивость или искренний смех в моменте всегда выглядят выигрышнее. Даже ваше чадо сможет отличить натянутую нейросетевую ухмылку от настоящей эмоции. Искусственный интеллект отлично понимает микровыражения, если задать их через обстоятельства: «laughing at a joke», «deep in thought».

Поиск идеальной комбинации токенов для совместного кадра с кумиром — это всегда увлекательный процесс, требующий насмотренности и понимания механики работы диффузионных моделей. Каждая ошибка здесь лишь ступенька к пониманию того, как мыслит машина. Удачи в бесконечных творческих экспериментах, пусть ваша цифровая коллекция встреч со знаменитостями пополняется исключительно шедеврами, а итоговая реалистичность кадров навсегда запомнится зрителям!