В сети представлено множество запросов для искусственного интеллекта, где солирует лишь один герой. Обыватель давно привык, что машина легко рисует портрет одинокой грустной девушки или пишет философский монолог от лица древнего мудреца. Устав от суеты одиночных сцен, пользователи всё чаще грезят сложными взаимодействиями, где участвуют сразу несколько фигур. Дело в том, что добавить в кадр или текст второго участника довольно сложно. Ведь начинается путаница с ролями, смешение лиц и полная наляпистость. Но чтобы избежать разочарований, нужно просто освоить особую архитектуру составления команд.
Зачем усложнять задачу?
Выбор сюжетов очень большой. Раньше генерация даже одного внятного силуэта казалась обыкновенным чудом, но сейчас планки качества взлетели до небес. Спрашивается, зачем же вводить второго героя? Ответ кроется в банальной динамике. Ведь именно взаимодействие творит чудеса, превращая плоскую картинку или сухой машинный текст в настоящую живую историю. К слову, львиная доля успешных коммерческих проектов всегда строится на конфликте или доверительном диалоге двух сторон. И всё же заставить программу разделить своё внимание на двоих — задача не из лёгких. Местный цифровой бомонд долго бился над проблемой сливающихся образов. С распределением атрибутов дело обстоит сложнее всего. Часто у блондинки внезапно отрастает густая борода её собеседника, а строгий деловой костюм превращается в лохмотья.
Нейросети для картинок: парный портрет
Пятно цифрового света падает на виртуальный холст. С этого микроскопического шага начинается работа графического алгоритма. Эстетичны ли подобные изображения? Сама по себе парная сцена не отличается красотой, если фигуры слиплись в неразборчивый ком плоти. Чтобы не сильно ударить по кошельку (особенно в платных сервисах), стоит прописывать внешность строго поэтапно. Начать нужно с общей сцены, освещённой тёплым закатным светом, наполненной подходящим антуражем. Далее вводится первый персонаж, облачённый в кожаную куртку, наделённый суровым взглядом. А следом вырисовывается вторая фигура, разительно контрастирующая с первой. Буквально десятилетие назад художники тратили на подобные эскизы долгие недели кропотливого труда, однако сейчас система справляется за три миллисекунды. Правда, иногда обязательно всплывут лишние пальцы или перекошенные лица. Это же классическая ложка дёгтя современных технологий.
Как разделить персонажей?
Механика обмана системы кроется в использовании чётких позиционных маркеров. Стоит отметить, что слова «слева» и «справа» понимают далеко не все генераторы. Выручит хитрое цветовое кодирование или метод жёсткого пространственного разделения. Например, рабочий добротный промт выглядит так:
«Фотография двух людей в уютном кафе. Слева сидит пожилой седой мужчина в красном шерстяном свитере, попивающий горячий кофе. Справа расположилась молодая девушка в синем шёлковом платье, читающая толстую книгу».
Разумеется, машина иногда ошибается. Но шансов на успех при такой формулировке гораздо больше. Да и самим творцам комфортнее работать с чёткой формулой, где каждый объект стоит на ногах и имеет свои границы. Не скупитесь на детальные уточнения гардероба.
Стоит ли экономить слова?
Конечно, короткие запросы писать быстрее, однако результат вас вряд ли порадует. Динамика. Это главное. Если герои просто стоят столбом, зрелище получается откровенно удручающее. Нужно обязательно добавлять активные глаголы действия. Впрочем, сложные физические махинации вроде парного танго боту даются с огромным трудом. Зато крепкие объятия или деловые рукопожатия генерируются довольно просто. Хорошей отправной точкой станет запрос:
«Два человека крепко пожимают друг другу руки на фоне ночного городского пейзажа. Один одет в строгий костюм, другой выбрал повседневную одежду. Фокус камеры направлен на сцепленные кисти».
Тем более, что именно щепетильная детализация контакта всегда приковывает внимание зрителя. Нельзя не упомянуть о нестандартных ракурсах. Снимая сцену сверху или снизу, можно кардинально изменить общее настроение картины. Откажитесь от абстрактных понятий вроде нежности или злости. Лучше опишите физические проявления этих эмоций.
Текстовые модели: ролевая игра
А вот с текстом всё обстоит совершенно иначе. Здесь ИИ выступает настоящим кладезем знаний, но без жёсткого контроля мгновенно теряет нить беседы. Чтобы запустить полноценный спор двух независимых личностей, придётся внести свою лепту в изначальные настройки памяти. К первой группе команд всегда относится строгое присвоение ролей. Далее следует подробное описание характеров, ну и, наконец, постановка самой проблемы. Выручит вот такой изысканный словесный конструкт:
«Ты должен симулировать жаркий спор двух людей. Первый герой — скептичный детектив из восьмидесятых годов, постоянно курящий сигары. Второй участник — восторженный подросток-хакер из нашего времени. Тема их спора: нужно ли взламывать секретную базу данных мэрии. Напиши их диалог на десять реплик».
Выглядит впечатляюще. И главное — работает. Ведь машина получает чёткие психологические рамки поведения для обеих сторон медали.
Контроль генерации
Сложности неизбежны. С одной стороны, текст льётся рекой и радует глаз, с другой — через пару длинных абзацев детектив вдруг начинает изъясняться молодёжным сленгом. Связано это с тем, что контекстное окно программы постепенно переполняется лишним мусором. Чтобы избежать размытия образов, не стоит забывать о регулярных технических напоминаниях. Периодически вставляйте в чат системные ремарки (каждые несколько сообщений). Формулируйте их жёстко:
«Продолжай диалог, обязательно помня, что детектив искренне ненавидит современные технологии».
Процесс этот не сложный, но довольно кропотливый. Заслуживает истинного уважения тот автор, который умеет удержать искусственный разум в рамках заданных характеров до самого финала. Ну и, конечно же, не перегружайте первичный промт лишними философскими вводными. Исконно русская привычка писать витиевато здесь лишь вредит делу.
Сценарии для ботов: парное интервью
Особый интерес вызывает формат структурированного интервью. Когда-то давно для написания правдоподобной беседы требовался настоящий живой журналист. Сейчас же колоритный самобытный материал можно получить за считанные минуты. Как выстроить правильную архитектуру? Задайте алгоритму жёсткие рамки поведения интервьюера и его гостя. Хорошо работает следующий запрос:
«Проведи текстовое интервью. Ты — ехидный модный журналист популярного глянца. Твой собеседник — скромный застенчивый учёный, случайно открывший новый вид прочного пластика. Журналист задаёт провокационные вопросы о деньгах, а учёный отвечает максимально сухо и по научным фактам».
Тем более, что такой резкий контраст темпераментов делает итоговый текст невероятно живым. А если ещё добавить в скобках сценические действия (вздохнул, поправил съехавшие очки, нервно рассмеялся), антураж беседы станет невероятно плотным.
Семейные драмы
И всё же самые яркие тексты получаются при имитации бытовых конфликтов. Ни одна театральная постановка не обходится без столкновения интересов. Понять тонкие человеческие обиды алгоритм часто не может, поэтому ему нужно прямо указывать на скрытые мотивы. Один из самых популярных видов взаимодействия – вечный конфликт поколений. Взрослый консервативный родитель и бунтующее непослушное чадо. Внести в запрос нужную искру можно так:
«Напиши спор отца и сына. Отец настаивает на поступлении сына в медицинский университет, постоянно апеллируя к финансовой стабильности. Сын же мечтает стать профессиональным киберспортсменом. Диалог должен быть коротким, но эмоциональным».
Такое серьёзное вложение сил в описание бэкграунда обязательно окупится отличным результатом. Настоящий рай для сценаристов и писателей, ищущих вдохновение.
Эксперименты с двойными сущностями всегда открывают перед авторами совершенно новые горизонты. Вникая в каждую мелкую деталь составления команд, любой человек сможет почувствовать себя требовательным режиссёром. Главное — всегда чётко разделять героев в пространстве, наделять их полярными мнениями и смело отсекать лишние словесные конструкции. Удачи в проектировании самых невероятных парных сюжетов, пусть каждый сгенерированный кадр или текст порадует вас своей живостью!