Буквально десятилетие назад создание собственной мелодии казалось уделом избранных творцов с профильным консерваторским образованием. Ведь для написания мало-мальски приличного трека требовались годы мучительного изучения сольфеджио, дорогие студийные часы и громоздкие железные синтезаторы. Сейчас же интернет буквально переполнен нейросетями, генерирующими практически любые мыслимые жанры за считанные секунды. Обыватель радостно потирает руки, ожидая грандиозного шедевра по нажатию одной единственной кнопки. Однако на практике вместо симфонического эпика довольно часто получается невнятная цифровая какофония звуков, бьющая по барабанным перепонкам. Но чтобы не ошибиться и получить действительно добротный результат, нужно освоить искусство правильного общения с капризным алгоритмом.
С чего начинается выбор?
Темп жёстко задан в сто двадцать ударов в минуту. Именно с таких скрупулёзных технических деталей обычно стартуют профессиональные запросы звукорежиссёров. Сложно ли неподготовленному человеку сразу выдавать подобные формулировки? Да, с непривычки мозг буквально закипает от невероятного обилия параметров.
Дело в том, что алгоритм совершенно не умеет читать мысли, ему нужна предельно чёткая координата в огромном бушующем океане звуков. Не стоит надеяться на абстрактные размытые фразы вроде «сделай мне красиво и грустно».
На самом деле, нейросети нужен конкретный и понятный жанровый вектор. К первой группе базовых настроек относится выбор основного стиля. Далее следует определение настроения или эмоциональной окраски композиции. Отдельно стоит упомянуть инструменты, которые будут уверенно солировать в вашем произведении. Ну и, наконец, прописывается ритмика и вокальные особенности.
Формирование запроса
Процесс не сложный, но кропотливый. Сначала композитор-любитель подбирает основное направление, безжалостно отсекая все лишние стили. Затем к выбранному жанру аккуратно подмешиваются эмоциональные эпитеты, задающие нужный тон всему полотну. После этого в текстовую строку вплетаются названия конкретных инструментов, обрастая важными уточнениями вроде «живой акустический» или «холодный синтетический». Завершается же этот подготовительный этап добавлением референсов на известные исторические эпохи или конкретные десятилетия. Это логично. Ведь именно такой подход позволяет разложить по полочкам хаотичные творческие порывы. К слову, львиная доля неудачных генераций связана именно с чрезмерной смысловой наляпистостью запроса. Не перегружайте строку взаимоисключающими параметрами. Зрелище удручающее, когда брутальный скандинавский дэт-метал наивные пользователи пытаются скрестить с тихой детской колыбельной мелодией.
Как подобрать идеальный референс?
Нужно отметить, что правильно и лаконично сформулированная задача творит настоящие чудеса. Разумеется, начинать свой путь в промпт-инжиниринге лучше с малого. Например, для создания ненавязчивой фоновой атмосферы уютного придорожного кафе стоит попросить алгоритм сгенерировать расслабляющий лоу-фай хип-хоп с мягким джазовым фортепиано, лёгким потрескиванием винила и медленным битом на восемьдесят ударов. Звучит впечатляюще. А вот оригинальное звуковое сопровождение для динамичной силовой тренировки потребует совершенно иных жёстких вводных. Здесь отлично выручит запрос на агрессивный киберпанк-синтвейв, усиленный перегруженным синтетическим басом, отлитый из жёстких электронных ударных, снабжённый пронзительными футуристическими эффектами (в стиле фантастики восьмидесятых). Безусловно, это серьёзное вложение вашего личного времени в бесконечные эксперименты. Впрочем, кошелёк станет легче только при оплате премиум-тарифов, тогда как сам получаемый опыт поистине бесценен. Естественно, заранее стоит задуматься о том, где именно будет звучать ваш цифровой шедевр.
Поп-музыка и вокальные партии
И всё-таки, способна ли бездушная машина спеть настоящим человеческим голосом? Вполне, хотя и звучит это иногда пугающе механически. Вся суть в том, что для вокальных треков требуется особая щепетильная настройка баланса частот. К тому же, сам текст будущей песни чаще всего придётся писать самостоятельно. Настоящий рай для поэтов. Если вы страстно желаете получить стандартный радиоформатный хит, попробуйте смело запросить современный танцевальный поп с глубоким женским соул-вокалом, плотной бас-бочкой, яркими мажорными синтезаторными арпеджио и позитивным летним настроением. Однако, если уставшая от суеты душа непреодолимо тяготеет к меланхолии, то безотказно сработает акустическая инди-фолк баллада с мужским хриплым голосом, медленным перебором нейлоновой гитары и глубокой пространственной реверберацией на заднем фоне. Само собой, в таких сложных махинациях непременно всплывут различные непредвиденные подводные камни. Иногда искусственный интеллект безжалостно проглатывает окончания слов или глупо путает ударения.
Оркестровая мощь в цифре
Мощные медные духовые оглушительно вступают на третьей секунде. Именно так в современных реалиях рождается грандиозный кинематографический эпос. Когда-то тихое место в студии композитора сейчас превратилось в гудящий раскалённый сервер, где каждый отдельный звук математически просчитывается за жалкие миллисекунды. Тем более, что для создания эпичного саундтрека к любительскому фантастическому видеоролику больше совершенно не нужен огромный Лондонский симфонический оркестр. Достаточно лишь прописать в командной строке монументальный голливудский саундтрек с постоянно нарастающим напряжением, доминирующими трубами, тяжёлыми маршевыми ударными и зловещим хором на латыни. Это же железное правило касается и более тихих, камерных сцен. Для них идеально подойдёт меланхоличный тёмный эмбиент, сыгранный на одинокой плачущей виолончели в огромном пустом зале с ярко выраженным эффектом эха. Конечно, живые профессиональные музыканты всегда вносят свою неповторимую человеческую лепту в исполнение, однако для быстрой фоновой озвучки роликов такие нейро-промты работают абсолютно безотказно.
Звуковой дизайн
Ложка дёгтя в этой огромной бочке мёда всё же незримо присутствует. Дело в том, что длинные пятиминутные композиции нейросети пока даются с огромным скрипом, а музыкальная структура часто безнадёжно разваливается после третьей минуты звучания. Поэтому для инди-игровых проектов или разговорных подкастов более целесообразно генерировать короткие зацикленные фрагменты. Не стоит забывать про популярный жанр дарк-эмбиента для инди-хорроров. Там великолепно сработает запрос на гнетущую подземную атмосферу, медленно плавающие низкие гудящие частоты, случайные металлические скрежеты и полное отсутствие ярко выраженного ритма. Да и самим разработчикам гораздо комфортнее оперировать небольшими удобными звуковыми блоками. Кстати, для рекламных коммерческих роликов маркетологи довольно часто используют корпоративный бодрый фон, состоящий из позитивных акустических гитар, ритмичных лёгких хлопков, звенящих колокольчиков и мажорных жизнерадостных аккордов. Внести финальную лепту в такое звучание можно будет уже непосредственно в монтажной программе.
Экзотика и смешение стилей
Заслуживает истинного уважения удивительная способность алгоритмов смело скрещивать совершенно несовместимое. Многие обыватели ошибочно считают, что машины мыслят исключительно сухо и шаблонно, но на самом деле их искусственная фантазия ограничена лишь вашей личной смелостью. Можно довольно легко облачить классический старинный венский вальс в тяжёлые перегруженные гитарные риффы. Или, например, в шутку запросить задорный кельтский панк-рок с доминирующей визжащей волынкой, сумасшедшим быстрым барабанным битом и агрессивными искажёнными электрогитарами. Главная изюминка подобных безумных экспериментов заключается именно в абсолютной непредсказуемости результата. Главное — правильно угадать с жанровой палитрой. Не скупитесь на необычные, яркие прилагательные. В сети часто натыкаешься на результаты запросов вроде тягучего психоделического джаз-фьюжна с инопланетными булькающими синтезаторами и сложным ломаным ритмом в семь восьмых. Ну, а если вы желаете с головой окунуться в приятное ретро, то классический синти-поп с аналоговыми старыми драм-машинами и неоновой ночной атмосферой восьмидесятых (с темпом около ста ударов) всегда звучит беспроигрышно.
Создание авторской музыки с помощью коротких текстовых команд — это колоритный и весьма самобытный процесс, требующий постоянной практики и хорошего музыкального вкуса. Нет никакого смысла переплачивать дорогим саунд-дизайнерам за простые фоновые мелодии для блогов, когда прямо у вас под рукой круглосуточно находится настоящая неисчерпаемая кладезь творческих возможностей. Просто смело открывайте интерфейс вашей любимой программы, вводите свои самые безумные идеи и совершенно не бойтесь совершать ошибки. Ведь каждая такая неудачная генерация неумолимо приближает вас к тому самому идеальному выверенному звучанию, которое обязательно порадует домочадцев и запомнится случайным слушателям надолго. Удачи в этом бесконечном увлекательном звуковом плавании.