Аудио класс Модель AIGC

В настоящее время в области аудио нет хорошей базовой модели.

Базовая модель	Время выпуска	Издатель	Примечания
dance-diffusion	2022.09	harmonai
audio-diffusion	2022.08	teticio
riffusion	2022.12	Seth Forsgren	Создайте спектрограмму на основе диффузионной модели, а затем превратите спектрограмму в музыку.
audioldm	2023.01	haoheliu
bark	2023.04	suno.ai

Текущая модель с открытым исходным кодом далека от приложения. Если вы хотите получить лучшие результаты, вы можете взглянуть на [mubert] (https://mubert.com/)

В дополнение к моделям для создания музыки или звука с нуля, еще одна технология, которая в настоящее время приближается к критической точке применения, — это преобразование речи.

Преобразование голоса — это метод, который изменяет голос говорящего-источника так, чтобы он звучал как голос другого целевого говорящего.

В настоящее время хорошо известны продукты so-vits-svc