Нейросети, способные создавать видео по текстовому описанию, ещё недавно казались чем-то из области научной фантастики, а сегодня они уже творят настоящие чудеса, доступные каждому. В сети представлено множество роликов, где коты летают в космосе, а исторические личности рассуждают о современных гаджетах. Естественно, обыватель, впервые столкнувшись с моделями вроде Sora или Runway, грезит о создании собственного мини-шедевра. Но чтобы не получить на выходе хаотичный и «поплывший» видеоряд, нужно скрупулёзно подойти к составлению запроса, или, как его принято называть, промта. А начать стоит с базовых принципов его построения.
Что такое видеопромт?
Задача не из лёгких. В представлении многих, промт – это простое описание желаемого, вроде «котёнок играет с клубком». На деле же это подробное техническое задание для искусственного интеллекта, своеобразный режиссёрский сценарий, упакованный в несколько предложений. Чем точнее и детальнее будет эта инструкция, тем выше вероятность получить результат, который не просто удивит, а по-настоящему впечатлит. От того, как вы сформулируете мысль, зависит всё: от ракурса камеры и цветовой гаммы до настроения сцены и даже физики движения объектов. В этом деле нет мелочей. Каждый нюанс, каждое слово может кардинально изменить итоговый ролик. Поэтому не стоит подходить к этому процессу легкомысленно.
Из чего состоит идеальный запрос?
С чего начинается выбор? С определения фундаментальных составляющих, которые станут скелетом вашего будущего видео. Нужно разложить по полочкам все элементы, которые вы хотите увидеть в кадре. Во-первых, это главный объект или персонаж. Не просто «девушка», а «молодая женщина с веснушками и рыжими волосами, собранными в небрежный пучок». Во-вторых, необходимо описать действие, которое происходит. Не «идёт», а «медленно бредёт по пустынной улочке старого города, освещённой тусклым светом фонарей». Ну и, наконец, стоит задать антураж – детали окружения, которые создадут нужную атмосферу. Например, «мостовая блестит после дождя, в витринах отражаются неоновые вывески». Соединив эти три компонента, вы уже получите довольно добротную основу для генерации.
Технические параметры и стилистика
Разумеется, одним лишь описанием сцены дело не ограничивается. Львиная доля успеха кроется в технических уточнениях. Именно они превращают простое описание в профессиональный запрос. Крайне важно указать стиль, в котором вы хотите видеть ролик. Это может быть «кинематографичный стиль, как у Уэса Андерсона», «аниме 80-х годов», «чёрно-белое нуарное кино» или «гиперреалистичная 3D-анимация». Кроме того, стоит добавить параметры камеры. Что это значит? Вы можете задать конкретный ракурс («вид с высоты птичьего полёта», «крупный план», «камера следует за персонажем»), тип объектива («широкоугольный объектив», «рыбий глаз») и даже освещение («золотой час», «жёсткий полуденный свет», «неоновое освещение»). Такие махинации позволяют управлять восприятием зрителя и придают видеоряду профессиональный вид.
Как добавить динамику и эмоции?
Статичная картинка, пусть и красивая, редко приковывает внимание надолго. Чтобы видео получилось живым, его нужно наполнить движением. Причём не только движением персонажей, но и движением камеры. Такие команды, как «плавный наезд камеры (dolly zoom)», «панорамный пролёт (panning shot)» или «лёгкая дрожь камеры (handheld camera shake)», творят настоящие чудеса. Они создают эффект присутствия и погружают зрителя в происходящее. Не стоит забывать и про эмоции. Ведь именно они – соль любого повествования. Прописывайте чувства персонажей напрямую: «усталый взгляд», «искренняя улыбка», «выражение задумчивости на лице». ИИ довольно хорошо считывает такие маркеры и транслирует их в мимике и жестах. Это же правило касается и общей атмосферы – «атмосфера меланхолии и одиночества», «ощущение праздника и беззаботности».
Примеры готовых промтов для вдохновения
Теория – это хорошо, но без практики она мертва. Давайте посмотрим на несколько конкретных примеров, которые помогут уловить суть.
Предположим, вы хотите создать атмосферный ролик о ночном городе. Вместо «машина едет по ночному городу» стоит написать нечто более развёрнутое: «Кинематографичный кадр. Винтажный кабриолёт мчится по залитому дождём неоновому мегаполису в стиле киберпанк. Камера расположена низко, вид от асфальта. Крупный план на вращающееся колесо, от которого разлетаются брызги. Атмосфера одиночества и скорости, стиль фильма «Бегущий по лезвию». Высокая детализация, 8K». Чувствуете разницу? Здесь есть всё: объект, действие, антураж, стиль и технические параметры.
А вот другой пример, уже с персонажем. Вместо «пожилой мастер делает часы» попробуйте так: «Макро-съёмка. Руки старого часовщика в кожаном фартуке скрупулёзно собирают сложный механизм антикварных часов. Мягкий тёплый свет от настольной лампы падает на латунные шестерёнки и рубиновые камни. В воздухе витают пылинки. Камера медленно панорамирует по столу, заваленному инструментами. Ощущение уюта и кропотливого труда, стиль фэнтези». Такой промт даёт нейросети кладезь информации для создания по-настоящему глубокой и детализированной сцены.
Ну и, конечно же, куда без природы. Запрос «красивый лесной пейзаж» вряд ли даст впечатляющий результат. А вот такой вариант сработает куда лучше: «Эпичный пролёт камеры над туманной сосновой долиной на рассвете. Первые лучи солнца пробиваются сквозь густые кроны деревьев, создавая длинные тени. Внизу по каменистому руслу течёт кристально чистая река. Вид с высоты птичьего полёта, снято на дрон. Гиперреализм, кинематографичное освещение, 4K, стиль National Geographic». Вся суть в том, чтобы нарисовать словами максимально подробную картину, не оставляя ИИ пространства для нежелательной импровизации.
Экспериментируйте, пробуйте разные комбинации стилей, ракурсов и описаний. Не бойтесь добавлять самые, на первый взгляд, незначительные детали, ведь именно они зачастую и становятся той самой изюминкой, которая превращает обычную генерацию в маленький шедевр. Удачи в ваших творческих начинаниях.