В сети представлено огромное множество завораживающих видеороликов, где несуществующие в реальности люди двигаются с поразительной грацией, заставляя обывателя сомневаться в собственных глазах. Многие считают создание подобной анимации чем-то из области фантастики, доступной лишь голливудским студиям с их многомиллионными бюджетами, но на самом деле инструменты давно лежат на поверхности. Буквально десятилетие назад компьютерный перенос движений требовал громоздких костюмов с датчиками, а сейчас всю работу выполняет алгоритм. Плохой сон для любого аниматора старой школы — это наблюдать, как машина за считанные секунды рендерит сложнейшие пируэты. Однако спектр возможностей искусственного интеллекта не безграничен, и для получения добротного результата придётся изрядно попотеть над текстовым запросом.
С чего начинается работа?
Строка ввода мигает курсором. Задача не из лёгких. Ведь машине нужно буквально разложить по полочкам каждое движение, иначе вместо изящной хореографии получится дёрганая наляпистость. Сложно ли добиться нужной пластики? Процесс не сложный, но кропотливый, требующий понимания того, как нейросеть воспринимает слова. Начать стоит с описания самого персонажа, облачённого в подходящую одежду. Дело в том, что свободные ткани помогают алгоритму лучше просчитывать динамику, создавая красивый шлейф. Далее следует указать конкретный стиль хореографии, будь то брейк-данс или балет. Последним в списке идёт освещение, которое творит чудеса, скрывая мелкие артефакты в глубоких тенях. Ну и, конечно же, не стоит забывать про ракурс камеры.
Стиль гранж в кадре
Разумеется, антураж играет важнейшую роль. Мрачные подворотни, освещённые неоновыми вывесками, подходят для уличных стилей как нельзя лучше. К слову, стоит отметить, что именно такой фон скрывает львиную долю визуальных ошибок алгоритма. Пример отличного запроса выглядит так:
молодая девушка в мешковатых джинсах, танцующая хип-хоп на мокром асфальте, освещённая красным неоном, съёмка снизу
Конечно, этот текст нужно перевести на английский язык, добавив технические параметры камеры. Выглядит впечатляюще, когда капли дождя разлетаются от резких движений кроссовок. И всё же не стоит перебарщивать с деталями заднего плана. Ведь именно главный герой солирует в этой композиции, а избыток мусора на фоне только собьёт нейросеть с толку.
Как выбрать освещение?
Свет бьёт прямо в объектив. Это отличный приём. Тем более, что контровое освещение подчёркивает силуэт, делая колоритный образ ещё более выразительным. Обязательно ли использовать студийный свет? Вовсе нет. Естественно, мягкий солнечный закат тоже прекрасно работает, особенно если мы генерируем спокойный контемпорари на берегу океана. Стоит задуматься о контрастах. С одной стороны, яркий дневной свет показывает все изъяны генерации, с другой — придаёт картинке реалистичный современный вид. Лучше отказаться от сложной студийной схемы с пятью источниками. Укажите в запросе один яркий луч, пробивающийся сквозь дым, и результат превзойдёт все ожидания.
Классика и балет
Исконно академические направления даются нейросетям тяжелее всего. Вся суть в том, что балет требует идеальной анатомической точности, а искусственный интеллект довольно часто путается в количестве пальцев или выгибает суставы под неестественными углами. Скептики скажут, что сгенерировать идеальный фуэте невозможно, но правильный подход решает и эту проблему. Попробуйте такой вариант:
балерина в белой пачке, выполняющая прыжок гранд-жете на сцене старинного театра, луч софита направлен сверху, высокая контрастность
Впрочем, если всплывут ошибки в прорисовке лица, всегда можно отвести камеру на общий план. Да и самим зрителям куда интереснее наблюдать за общим рисунком танца, чем вглядываться в мимику.
Технические нюансы
Кадровая частота. Короткий параметр, меняющий всё. Для плавной картинки имеет смысл прописывать высокий фреймрейт, иначе движения будут казаться рваными. Кстати, не скупитесь на упоминание конкретных моделей камер (например, Arri Alexa). Алгоритмы обучены на фотографиях и видео с этих устройств, поэтому они охотнее выдают кинематографичную картинку. Подводные камни кроются в длительности генерации. Серьёзное вложение времени потребуется для создания хотя бы десяти секунд вменяемого видео. Кошелёк станет легче, если использовать платные облачные сервисы, но бесплатные аналоги пока что не могут выдать нужной стабильности.
Этнические мотивы
Особый интерес вызывает самобытный народный танец. Египетская цивилизация всегда вызывала трепет, поэтому запросы с восточными танцовщицами пользуются грандиозной популярностью. Тут изюминка кроется в деталях одежды, позвякивающей при каждом движении. Впишите в промт:
девушку, танцующую танец живота на фоне песчаных барханов, украшенную золотыми браслетами
Однако не стоит гнаться за чрезмерной экзотикой. Если смешать индийское сари, японский веер и испанский фламенко, машина выдаст удручающую кашу. Главное — выдержать единый стиль.
Сложности и ошибки генерации
Скрупулёзный подход спасает от разочарований. Часто натыкаешься на ролики, где ноги персонажа проваливаются сквозь пол. Это связано с тем, что нейросети пока слабо понимают физику твёрдых тел. Спасательный круг здесь — правильный ракурс. Выручит поясной портрет или съёмка в движении, когда камера постоянно меняет угол обзора. А вот статичный общий план безжалостно обнажит все недочёты. Безусловно, со временем эти махинации с ракурсами уйдут в прошлое, алгоритмы станут умнее. Ну, а пока приходится хитрить и искать обходные пути.
Удачные эксперименты с промтами точно принесут немало удовольствия, а готовый видеоролик обязательно порадует домочадцев и удивит коллег.