Промт для замены лица (с примерами готовых промтов)

Буквально десятилетие назад качественный фотомонтаж казался уделом узкого круга профессионалов, часами колдовавших в графических редакторах ради одного снимка. Сегодня же ленты социальных сетей переполнены невероятно реалистичными портретами, где обыватель предстаёт в образе голливудской звезды или сурового викинга. Искусственный интеллект творит чудеса, стирая границы между скучной реальностью и безграничным вымыслом. Люди грезят о красивых аватарах, пытаясь облачиться в цифровые рыцарские доспехи или примерить роскошные бальные платья (эпохи Ренессанса). За кажущейся простотой скрываются сложнейшие вычислительные процессы, требующие от пользователя предельно чёткого руководства. Но чтобы не ошибиться и получить поистине грандиозный результат, нужно освоить искусство составления грамотных текстовых запросов.

Зачем вообще менять лица?

Задача не из лёгких. Ведь машина мыслит совершенно иными категориями, нежели живой человек. С одной стороны, можно просто загрузить случайную фотографию и нажать заветную кнопку, слепо надеясь на технологическое чудо. С другой стороны, результат часто выглядит откровенно вычурным, а порой даже пугающим до мурашек. Для создания колоритного самобытного образа придётся внести свою лепту, тщательно подбирая каждое слово в строке ввода. Подобные махинации с изображениями обычно затевают ради забавы, создания персонализированных подарков или даже для виртуальной примерки сложного макияжа. Кошелёк станет легче довольно быстро, если каждый раз обращаться к наёмным ретушёрам. Поэтому освоение генерации станет отличным спасательным кругом для творческих натур. К тому же, сам процесс захватывает невероятно сильно.

Рабочая среда

Выбор подходящей платформы пугает новичков. На рынке сегодня солирует сразу несколько мощнейших нейросетевых моделей. К первой группе относится нашумевший бот «Midjourney», славящийся своей невероятной художественностью. Далее следует строгий алгоритм «Stable Diffusion», устанавливаемый локально и предоставляющий творцу абсолютный контроль над каждым пикселем изображения. Отдельно стоит упомянуть различные утилиты в популярных мессенджерах, адаптированные под мгновенную замену, где процесс сводится к банальной отправке двух картинок в чат. Разумеется, для серьёзных профессиональных задач лучше отказаться от таких сильно упрощённых версий. Не стоит забывать, что качественный тяжёлый софт требует соответствующего железа, иначе творческий порыв превратится в мучительное ожидание длиной в сорок минут. А сборка отдельного производительного компьютера — это серьёзное вложение, которое ощутимо бьёт по бюджету семьи. Впрочем, облачные сервисы аренды мощностей всегда могут выручить.

Как выбрать исходник?

Мутные пиксели в углу экрана. Именно с такой неудачной картинки часто начинается горькое разочарование неопытного пользователя. Дело в том, что искусственный интеллект — крайне щепетильный критик, которому подавай идеальное исходное качество. Ровное, хорошо освещённое лицо на исходнике венчает всю будущую композицию. Освещение должно распределяться равномерно, без глубоких чёрных теней, скрывающих половину скулы или глазные впадины. Открытые глаза, смотрящие прямо в объектив камеры, приковывают внимание алгоритма, позволяя ему максимально точно считать геометрию черепа. Не стоит брать фотографии, где человек громко смеётся или сильно щурится. Искажённые мимикой пропорции неминуемо всплывут в итоговом результате в виде жутких артефактов. К слову, львиная доля неудачных генераций связана именно с неправильно падающим светом.

Подготовка к генерации

Внушительный массив английского текста часто отпугивает неподготовленных людей. Но на самом деле структуру правильного запроса довольно просто разложить по полочкам, если понять базовые постулаты.

Начинать нужно с определения главного объекта сцены и его конкретного действия. Затем черёд детализации окружения наступает, после чего аккуратно вписывается описание стилистики. Лишь в самом конце строки добавляются сухие технические параметры камеры. И всё-таки, главным элементом остаётся скрупулёзный подход к описанию самого персонажа. Машина совершенно не понимает поэтических абстракций. Вместо красивых размытых фраз придётся использовать точные медицинские или художественные термины. Это тяжёлый, но невероятно эффективный способ добиться сходства.

Промты для нейросетей: реалистичный портрет

С чего начинается создание фотографического шедевра? С правильного описания мельчайшей фактуры. Чтобы получить добротный классический снимок, нужно прописать текст, полностью имитирующий работу профессионального студийного фотографа. Один из самых популярных вариантов запроса звучит как портрет молодого человека тридцати лет, снятый на объектив с фокусным расстоянием восемьдесят пять миллиметров, с диафрагмой один и восемь. Далее в строку вписывается обязательное упоминание мягкого света, падающего под углом сорок пять градусов. Следующим важным критерием выступает детализация кожного покрова — прописываются поры, лёгкая природная асимметрия, естественный жирный блеск лба. Последним в этом перечне идёт указание сверхвысокого разрешения в восемь ка. Тем более, что именно эти волшебные технические слова избавляют итоговое лицо от жуткого эффекта пластиковой манекенной куклы.

Стиль киберпанк в портретах

Неоновые блики на мокром асфальте. Антураж мрачного мегаполиса будущего всегда вызывал особый интерес у преданных любителей фантастики. Чтобы с головой окунуться в эту вязкую атмосферу, базовый портретный запрос придётся кардинально модифицировать. Начинаем мы с описания сурового персонажа, облачённого в толстую кожаную куртку, снабжённую светящимися диодами. Затем добавляем описание освещения — резкий контрастный свет, состоящий из переплетающихся синих и агрессивных пурпурных оттенков. Настоящая же изюминка кроется в деталях заднего фона, где сквозь густой туман должны просматриваться размытые силуэты исполинских небоскрёбов. Полученный текстовый блок генерирует роскошную основу. Затем на неё, с помощью специализированных плагинов замены, накладывается нужное человеческое лицо. Зрелище получается поистине удручающее, если сильно переборщить с неоновым свечением. Поэтому баланс насыщенности оттенков критически важен.

Сложно ли избежать ошибок?

Конечно, первые блины практически всегда выходят комом, однако отчаиваться нет абсолютно никакого смысла. Многие наивно считают, что сложный алгоритм должен моментально выдавать стопроцентный идеал. На самом деле это долгий мучительный процесс бесконечных итераций. Обыватель часто натыкается на проблему внезапно выросших двойных подбородков или откровенно поехавших в разные стороны глаз (особенно в «Stable Diffusion»). Это напрямую связано с тем, что программа отчаянно пытается совместить физически несовместимые ракурсы. Лицо с исходной фотографии смотрит прямо на зрителя. А сгенерированное виртуальное тело крепко стоит на ногах в профиль. Вся суть в том, что векторы направления взгляда должны совпадать вплоть до градуса. Существенная ложка дёгтя кроется ещё и в несовпадении оттенков кожи. Голова часто выглядит так, будто её грубо приклеили клеем от совершенно другого человека. Чтобы избежать этой раздражающей наляпистости, опытные мастера применяют локальное маскирование.

Фэнтези и исторические эпохи

Тяжёлые рыцарские доспехи, ослепительно сверкающие на полуденном солнце. Глубокая эпоха средневековья всегда тяготеет к совершенно иным цветовым схемам и грубым текстурам. Здесь полноправно солирует плотная натуральная ткань, поцарапанная в боях сталь, а также приглушённый тёплый свет восковых свечей. Текстовый запрос выстраивается исключительно вокруг густой атмосферы: портрет усталой женщины в роскошном бархатном платье изумрудного цвета, стоящей у пылающего каменного камина. Обязательно добавляются слова о кинематографичном глубоком освещении. А вот упоминание стилистики картин великого Рембрандта способно в одночасье кардинально изменить всю световую картину. Естественно, перенесённое сюда лицо категорически не должно сиять белоснежной современной голливудской улыбкой. Вычурный современный макияж моментально разрушит весь колоритный старинный образ. Не стоит забывать о крошечных пылинках, медленно танцующих в лучах света. Они придадут невероятной живости плоскому изображению.

Интеграция в живопись

Настоящий кладезь вдохновения скрыт в классическом изобразительном искусстве. Светский бомонд прошлых веков оставил нам огромное наследие в виде потрясающих холстов. Замена лиц на известных картинах не сильно ударит по кошельку, если делать это самостоятельно в домашних условиях. Процесс создания живописного текста требует знания специфической терминологии. Сначала указывается техника — густые мазки масляной краской, акварельная полупрозрачная заливка или штриховка угольным карандашом. Тем более, нейросети прекрасно знают стили тысяч известных художников мира. В текст вписывается имя Ван Гога, Клода Моне или даже Сальвадора Дали. Исконно классические сюжеты обретают совершенно новое, иногда весьма неоднозначное звучание. Однако подводные камни здесь прячутся в фактуре холста. Лицо с обычной фотографии получается слишком гладким, пугающе реалистичным на фоне нарисованного окружения. Приходится дополнительно прогонять готовый результат через фильтры стилизации.

Замена лиц в семейных архивах

Реставрация старых пожелтевших снимков всегда вызывает бурю неподдельных эмоций. Когда любимое чадо вдруг предстаёт в образе прадедушки-авиатора, восторг льётся рекой. Для создания таких трогательных домашних проектов требуется максимально деликатный подход. Бюджетный вариант — использовать простые телефонные приложения, но качество там оставляет желать лучшего. В серьёзных программах промт составляется с упором на ретро-эстетику. Прописывается сепия, зернистость старой фотоплёнки, виньетирование по краям кадра и царапины на эмульсии. Безусловно, одежда тоже должна строго соответствовать выбранному десятилетию. Согласитесь, современная футболка с ярким принтом будет смотреться крайне нелепо на фотографии в стиле тридцатых годов прошлого века. К тому же, современные нейросети умеют генерировать аутентичные интерьеры того времени, будь то старая советская квартира или салон изысканного американского автомобиля.

Тонкая настройка

Детали незаметно решают абсолютно всё. Иногда даже самый изысканный, невероятно сложный текст не даёт автору желаемого результата. Тогда на виртуальную сцену гордо выходят негативные запросы, строго указывающие бездушной машине, чего делать категорически нельзя. Сюда опытные инженеры обычно вписывают уродливые телесные пропорции, лишние пальцы на руках, сильно размытый задний фон или чрезмерную глянцевую гладкость кожи. Это же железное правило касается и мультяшности. Если нужен суровый реализм, слово «три-дэ» должно навечно стоять в запретном блоке текстового поля. Да и самим творцам гораздо комфортнее, когда они полноценно контролируют обе стороны медали. Нужно отметить, что использование дополнительных референсных изображений значительно ускоряет черновую работу, давая искусственному интеллекту очень чёткий визуальный якорь. Ну и, конечно же, не нужно бояться экспериментов с весами отдельных слов внутри самого запроса, усиливая или ослабляя их влияние цифрами.

Освоение передовых нейросетевых технологий открывает поистине невероятные горизонты для домашнего творчества, позволяя без труда воплощать самые безумные визуальные задумки. Стоит лишь проявить немного усидчивости и терпения, чтобы научиться говорить с умной машиной на одном понятном языке. Смело экспериментируйте со сложным освещением, не бойтесь дерзко смешивать несовместимые на первый взгляд стили. Тщательно подбирайте только самые качественные исходные фотографии, отбраковывая неудачные ракурсы. Пусть каждый сгенерированный вами портрет поражает зрителей своей недосягаемой глубиной и пугающей реалистичностью. Удачи в создании ваших идеальных цифровых шедевров!