Skip to Main Content

Аудио класс Модель AIGC

В настоящее время в области аудио нет хорошей базовой модели.

Базовая модельВремя выпускаИздательПримечания
dance-diffusion2022.09harmonai
audio-diffusion2022.08teticio
riffusion2022.12Seth ForsgrenСоздайте спектрограмму на основе диффузионной модели, а затем превратите спектрограмму в музыку.
audioldm2023.01haoheliu
bark2023.04suno.ai

Текущая модель с открытым исходным кодом далека от приложения. Если вы хотите получить лучшие результаты, вы можете взглянуть на [mubert] (https://mubert.com/)

В дополнение к моделям для создания музыки или звука с нуля, еще одна технология, которая в настоящее время приближается к критической точке применения, — это преобразование речи.

Преобразование голоса — это метод, который изменяет голос говорящего-источника так, чтобы он звучал как голос другого целевого говорящего.

В настоящее время хорошо известны продукты so-vits-svc