Холодные прикосновения, пустые стеклянные взгляды и механические, почти ломаные движения партнёров, застывших в пространстве безликой студии. Именно такую атмосферу цифровой бомонд сегодня пытается вытянуть из нейросетей, устав от бесконечного потока глянцевых романтических сцен. Заставить генеративную модель изобразить глубокое эмоциональное отчуждение — задача не из лёгких, требующая щепетильного подхода к каждому токену. Ведь изначально большинство алгоритмов тяготеет к гармонии, пытаясь сблизить фигуры в кадре, нарисовать на их лицах улыбки и создать иллюзию привязанности. Но чтобы не ошибиться в формулировках и сломать этот позитивный паттерн, нужно грамотно выстроить лексическую структуру запроса.
Зачем переплачивать за нейросети? Экономьте сотни долларов каждый месяц 💸
Оплачивать Midjourney, премиум-версии ChatGPT, видео- и аудио-генераторы по отдельности — это безумно дорого и неудобно. Этот сервис решает проблему! Получите полный пакет премиум-моделей (более 90 топовых нейросетей) по цене одной доступной подписки. Безлимитные возможности, никаких скрытых платежей и сгорающих токенов при активном тарифе.
Перестаньте платить за 10 разных сайтов. Выбирайте выгоду и творите без ограничений 👉 https://clck.ru/3RNCRL
Как передать холодность?
Наряд для избранных. Именно одежда танцоров солирует в создании визуального барьера между персонажами. От лёгких струящихся тканей лучше отказаться сразу. Дело в том, что плотные текстуры вроде драпа или грубой кожи визуально утяжеляют силуэт, делая движения менее плавными. Строгий мужской костюм, застёгнутый на все пуговицы, дополненный глухим воротником, создаёт ощущение закрытости. К слову, женский образ стоит прописывать в похожем ключе, избегая открытых плеч или летящих юбок. Окунуться в эту атмосферу поможет упоминание оверсайз-пальто или бесформенных свитеров, скрывающих линии тела. Да и самим виртуальным актёрам гораздо комфортнее существовать в кадре, когда их контуры чётко отделены друг от друга плотной материей.
С чего начинается выбор окружения? С определения уровня освещённости. Выручит контровой холодный свет, бьющий прямо в спину фигурам. Синеватые больничные оттенки или тусклый свет неоновых ламп творят чудеса, когда требуется убить любую романтику. В представлении многих обывателей для драмы обязательно нужна гроза или дождь, но на самом деле именно стерильная пустота передаёт нелюбовь гораздо точнее. Мрачный индустриальный пейзаж за окном, пустой бетонный зал или заброшенная станция метро добавят нужного антуража. Разумеется, стоит упомянуть в промте низкий ключ и резкие, графичные тени, которые разрезают пространство между мужчиной и женщиной.
Динамика отторжения
По мутному стеклу медленно стекают тяжёлые капли дождя. С такой мелкой детали часто начинается построение хорошей сцены в голове инженера. Далее следует описание самой биомеханики тел. Глаголы в запросе должны исключать любую синхронность. Слова вроде «отстраняется», «избегает зрительного контакта», «двигается асинхронно» станут настоящим спасательным кругом. К первой группе удачных формулировок относится описание дистанции. Во-вторых, нужно чётко прописать положение рук, которые не обнимают, а скорее отталкивают или безвольно висят вдоль туловища. Ну и, наконец, геометрия тел должна быть угловатой, лишённой привычной танцевальной пластики.
Всплывут ли артефакты при таких сложных позах? Естественно, нейросеть будет сопротивляться. Анатомия — это извечная ложка дёгтя в генерации видео. Лишние пальцы или сливающиеся конечности льются рекой, если пустить процесс на самотёк. Скрупулёзный контроль веса каждого токена тут просто необходим. Тем более, что современные интерфейсы позволяют брать важные слова в скобки, усиливая их влияние на финальный рендер. Обязательно ли писать длинные простыни текста? Вовсе нет. Короткие, рубленые фразы, разделённые запятыми, работают ничуть не хуже. Главное — угадать с балансом, не перегружая алгоритм лишними литературными эпитетами.
Что насчёт стилизации?
Выбор жанра огромен. С одной стороны, можно взять за основу классический балет, сломав его грацию отрывистыми паузами, с другой — обратиться к японскому танцу буто, который исконно строится на внутренней боли и искажении. На самом деле, изюминка кроется в самом диссонансе. Когда-то страстное аргентинское танго сейчас превратилось в отличный полигон для таких махинаций. Если заставить партнёров исполнять базовые шаги танго с абсолютно равнодушными лицами (смотрящими в разные стороны), результат получится весьма внушительный. Безусловно, процесс подбора стиля не быстрый, но он того стоит. К тому же, добавление терминов из контемпорари-дэнс поможет алгоритму понять, что от него требуют не классическую постановку, а концептуальный перформанс.
Технические аспекты генерации
Это дорого. Ведь облачный рендер высокого разрешения серьёзно бьёт по бюджету. Нет смысла переплачивать за длительные видеоролики, лучше сосредоточиться на коротких четырёхсекундных отрезках. Мощный графический процессор, охлаждаемый массивными кулерами, загруженный сложными вычислениями, выдаст идеальный результат только при правильных настройках семплера. Значение параметра CFG Scale стоит держать в пределах семи или восьми единиц. При более высоких значениях картинка приобретёт ненужную наляпистость, а при низких — потеряет детализацию лиц. Впрочем, многие исследователи намеренно снижают этот параметр, чтобы получить слегка размытый, призрачный эффект.
Нельзя не упомянуть и про негативные промты. Это обе стороны медали. Если в основном поле мы описываем холод, то в негативном должны разложить по полочкам всё, что связано с теплом. Слова «страсть», «улыбка», «влюблённость», «тесный контакт» и «радость» нужно вписывать туда первыми. Буквально десятилетие назад такие тонкие настройки казались чем-то из области фантастики, но сейчас это базовая рутина. Львиная доля успеха зависит именно от того, насколько добротный негативный запрос вы составили. От абстрактных понятий лучше отказаться, заменив их конкретными физическими проявлениями эмоций, которые вы не хотите видеть в кадре.
Влияние оптики на восприятие
Камера творит чудеса. Объектив, дополненный анаморфотной линзой, покрытый лёгкой пылью, сфокусированный на пустом пространстве между людьми, задаст правильный тон всей композиции. Фокусное расстояние в пятьдесят миллиметров обеспечит реалистичные пропорции, не искажая лица танцоров. А вот оригинальное название киноплёнок, добавленное в конец промта, добавит зернистости. Заслуживает истинного уважения тот автор, который не забывает прописывать движение виртуальной камеры. Медленный отъезд назад или статичный общий план подчеркнут одиночество героев. И всё же, не стоит гнаться за чрезмерно сложными траекториями пролёта, так как избыточная динамика фона отвлекает от мертвенной статики самих персонажей.
Постулаты кинематографичной грусти требуют соблюдения определённых правил колористики. Блёклая, почти монохромная палитра с вкраплениями стального серого и грязного зелёного цвета справится с задачей превосходно. Яркие акценты здесь совершенно не нужны. Ведь именно отсутствие цвета часто воспринимается человеческим глазом как отсутствие жизни или чувств. Да и самой нейросети гораздо проще свести картинку в единый тон, избегая цветовых пятен, которые могут случайно сместить акцент на ненужную деталь.
Каждый нюанс имеет значение, когда вы пытаетесь визуализировать пустоту. Удачи в этих неоднозначных визуальных экспериментах, пусть каждый сгенерированный кадр бьёт точно в цель, вызывая у зрителя то самое чувство ледяного эстетического восторга!