В сети гремит настоящая революция, связанная с генеративным искусственным интеллектом. Буквально каждый день появляются новые нейросети (Midjourney, Stable Diffusion и др.), а обыватели, далёкие от программирования и дизайна, с упоением создают фантастические миры, портреты несуществующих людей и концепт-арты. Однако эйфория от первых успехов довольно быстро сменяется разочарованием, когда возникает задача посложнее: создать не просто одного персонажа, а пару, да ещё и так, чтобы они выглядели гармонично, взаимодействовали друг с другом и сохраняли свою внешность от генерации к генерации. Удивительно, но именно здесь, в задаче на постоянство и взаимодействие, львиная доля пользователей натыкается на невидимую стену. А ведь чтобы её преодолеть, нужно всего лишь научиться правильно «общаться» с машиной.
Что такое парный промт?
Начать стоит с определения. Промт для создания пары – это не просто набор слов, брошенный в чат-бота. Это, по сути, подробнейшее техническое задание, почти сценарий для двух актёров, где скрупулёзно прописана каждая деталь. Если одиночный портрет можно получить интуитивно, экспериментируя с запросами вроде «красивая девушка в стиле фэнтези», то для парной композиции такой подход обречён на провал. Нейросеть просто не поймёт, кто из них кто, как они связаны и что должны делать. Она сгенерирует двух случайных людей, которые могут даже не смотреть друг на друга. Поэтому главная цель парного промта — разложить по полочкам всю информацию, чтобы у ИИ не осталось пространства для нежелательной импровизации. Процесс несложный, но кропотливый, требующий внимания к мелочам.
Основа основ: Описание персонажей
Задача не из лёгких. Фундамент любого успешного парного изображения — это раздельное и максимально подробное описание каждого персонажа. Забудьте об общих фразах. Здесь придётся поработать почти как писатель, создающий героев для романа. Во-первых, нужно дать каждому персонажу условное имя или обозначение (например, «мужчина» и «женщина», «персонаж 1» и «персонаж 2»). Это помогает нейросети разделять атрибуты и не смешивать их в одну кучу. Во-вторых, для каждого из них стоит детально прописать внешность. Не просто «карие глаза», а «глубокие миндалевидные глаза цвета тёмного шоколада». Не просто «светлые волосы», а «длинные пепельно-русые волосы, собранные в небрежный пучок». Чем больше таких уточнений — телосложение, рост (хотя бы относительный, вроде «высокий мужчина и миниатюрная девушка»), особые приметы (родинка над губой, лёгкий шрам на брови), — тем выше шанс на постоянство образа. Ну и, конечно же, одежда. Стиль, цвет, фактура ткани — всё это вносит огромную лепту в конечный результат.
Как задать взаимодействие и эмоции?
Итак, наши «актёры» готовы. Что дальше? А дальше самое интересное — режиссура. Именно на этом этапе мы превращаем двух статистов в живую пару. Просто указать «пара стоит вместе» — это получить двух манекенов в витрине магазина. Необходимо конкретизировать их позы и действия. Мужчина нежно обнимает женщину за талию, она кладёт голову ему на плечо. Они сидят за столиком в кафе и смеются, глядя друг на друга. Он ведёт её за руку по осеннему парку. Каждое такое действие — это чёткая команда для нейросети. Кроме физического взаимодействия, не стоит забывать об эмоциональной составляющей. Слова «нежный взгляд», «счастливая улыбка», «лёгкая грусть», «задумчивое выражение лица» творят настоящие чудеса, наполняя картинку жизнью и историей. С одной стороны, это усложняет промт, но с другой — именно эти детали и отличают бездушную генерацию от произведения, приковывающего внимание.
Промт для романтической фотосессии: Пример
Давайте перейдём от теории к практике. Представим, что мы хотим создать изображение влюблённой пары в антураже уютной городской кофейни. Задача — передать атмосферу тепла, близости и лёгкой меланхолии дождливого дня.
Кинематографичный кадр, гиперреализм. Мужчина (около 30 лет, короткие тёмные волосы, лёгкая щетина, одет в тёмно-серый шерстяной свитер) и женщина (около 28 лет, длинные волнистые рыжие волосы, веснушки на носу, одета в бежевый кашемировый кардиган) сидят за маленьким деревянным столиком у окна в уютной кофейне. За окном идёт дождь, капли стекают по стеклу. Мужчина держит её руку в своей, они оба смотрят друг на друга с нежной улыбкой. На столе стоят две чашки с капучино. Мягкий, тёплый свет от лампы над столом. Цветовая палитра: приглушённые коричневые, бежевые, оранжевые тона. Стиль съёмки как у камеры Canon 5D Mark IV с объективом 50mm f/1.2, боке на заднем плане.
Что мы здесь видим? Во-первых, чёткое разделение на «мужчину» и «женщину» с детальным описанием их внешности и одежды. Во-вторых, прописанное взаимодействие («держит её руку», «смотрят друг на друга») и эмоция («нежная улыбка»). В-третьих, детально проработанный антураж, который задаёт настроение. Ну и, наконец, технические параметры съёмки, которые помогают нейросети лучше понять, какой именно стиль изображения от неё требуется. Такой добротный, скрупулёзный подход многократно повышает шансы на успех.
А если нужна динамика?
Романтические сцены — это прекрасно, но что, если наша пара — авантюристы, герои боевика или исследователи затерянных миров? Стоит ли менять подход? Отчасти. Основа — раздельное описание персонажей — остаётся незыблемой. Однако на первый план выходит глагол, действие. Вместо «сидят» и «смотрят» солировать будут «бегут», «сражаются», «карабкаются», «смотрят на взрыв».
Динамичный экшен-кадр. Персонаж 1 (атлетичный мужчина с кибернетической рукой, в тактическом жилете поверх чёрной футболки) и Персонаж 2 (девушка с ярко-розовыми волосами, в кожаной куртке) бегут по залитой неоновым светом улице ночного мегаполиса. Вокруг летающие автомобили и голографическая реклама. Мужчина стреляет из бластера, прикрывая девушку. Она оглядывается через плечо с решительным выражением лица. Эффект размытия в движении, брызги дождя. Холодная цветовая гамма с акцентами на розовый и голубой неон. Высокая детализация.
Как видите, суть та же, но акценты смещены на движение и напряжение момента.
Типичные ошибки новичка
На пути к созданию идеальной пары обывателя поджидает несколько подводных камней. Первая и самая главная ошибка — это излишняя абстракция. Запросы вроде «влюблённая пара на закате» дадут самый предсказуемый и клишированный результат. Нейросеть возьмёт усреднённые образы из своей базы данных, и вы получите нечто безликое. Не скупитесь на детали, ведь именно они создают изюминку.
Второй подводный камень — перегрузка запроса противоречивыми деталями. Попытка впихнуть в один промт и готику, и киберпанк, и барокко, скорее всего, приведёт к визуальной каше. Нужно придерживаться одного стиля. Тем более что современные модели ИИ довольно хорошо понимают стилистические запросы.
Ну и, наконец, многие забывают про такой мощный инструмент, как негативные промты. Это поле, куда вы вписываете всё, чего НЕ хотите видеть на изображении. Кривые руки, лишние пальцы, мультяшный стиль, размытое лицо, уродливые черты — всё это стоит перечислить в негативном запросе. Это своего рода спасательный круг, который помогает отсечь львиную долю брака.
Главное — не бояться экспериментов и подходить к процессу творчески. Не стоит рассматривать нейросеть как волшебную кнопку, это скорее музыкальный инструмент, на котором нужно научиться играть. Удачи в создании ваших идеальных цифровых пар, которые, возможно, станут героями целых историй.