Сотрудники Университета Ватерлоо, Канада, разработали систему для создания текстов песен, которые соответствуют стилю определенных музыкальных исполнителей. По их словам, она призвана не заменить артистов, а, наоборот, помочь им.
Подход ученых, изложенный в статье, которая опубликована на arXiv.org, использует вариационный автокодировщик (variational autoencoder, VAE) с вложениями артистов и классификатор CNN, обученный имитировать стиль артистов по MEL-спектрограммам их музыкальных клипов.
«Мотивация для этого проекта зарождалась из личных интересов. Музыка – моя страсть, и мне было любопытно, может ли машина генерировать строки, которые бы звучали как тексты моих любимых музыкальных исполнителей. Работая над моделями генерации текста, мы с коллегами обнаружили, что нейронные сети могут генерировать некоторые весьма впечатляющие строчки. Следующим естественным шагом для нас стала попытка выяснить, может ли машина изучить «сущность» лирического стиля конкретного музыкального исполнителя, включая выбор слов, темы и структуры предложений, для создания новых текстов, которые звучат так же, как если бы их написал сам артист», – рассказывает ведущий автор исследования Ольга Вечтомова.
Система, разработанная исследователями, основана на модели нейронной сети, которая известна как вариационный автокодировщик, способная к самообучению путем восстановления оригинальных строк текста. Чтобы сгенерировать строчки в стиле конкретного исполнителя, ученые предоставили нейросети для изучения большой каталог текстов артистов, выраженный через действительные числа. Затем исследователи интегрировали тексты исполнителей, чтобы система смогла разобрать особый стиль каждого творца. Цель ученых заключалась в том, чтобы сгенерированные произведения отличались не только в лирическом, но и музыкальном стиле.
В серии предварительных тестов разработанная система продемонстрировала замечательные результаты. Результаты показали, что интеграция артиста полезна для создания текстов, которые соответствуют его стилю. Многие строчки, сгенерированные системой, весьма соответствовали выбранному исполнителю, отражая те темы, которые тот обычно поднимает в своем творчестве. Хотя сгенерированные строчки часто содержали слова исходного исполнителя, они использовались в новом, интересном ключе, выражая новые мысли, которых нет в оригинальном тексте. По словам Вечтомовой, некоторые из созданных строк передают новые и довольно мощные поэтические образы, выраженные с использованием метафор и оксюморонов, при этом сохраняя стиль артиста.
«Система предназначена не для того, чтобы заменить музыкальных исполнителей, а для того, чтобы те могли использовать ее в качестве источника вдохновения в процессе написания песен. Это может быть аналогом синтезатора, который способен генерировать бесконечное количество звуков, из которого художник затем создает песню. Точно так же этот инструмент может генерировать бесконечное количество новых строк, которые художники могут использовать любым способом», – объясняет ученый.