Audio AIGC Model
Actuellement, il n'existe pas de bons modèles de base disponibles dans le domaine audio.
Basic Model | Release Date | Publisher | Note |
---|---|---|---|
dance-diffusion | 2022.09 | harmonai | |
audio-diffusion | 2022.08 | teticio | |
riffusion | 2022.12 | Seth Forsgren | Generates a spectrum using a diffusion model and converts it to music |
audioldm | 2023.01 | haoheliu | |
bark | 2023.04 | suno.ai |
Les modèles open source actuellement disponibles ont une certaine distance par rapport à l'application. Si vous voulez faire l'expérience de meilleurs effets, vous pouvez jeter un œil à mubert.
Outre les modèles permettant de générer de la musique ou du son à partir de zéro, une autre technologie qui approche actuellement du seuil d'application est la conversion vocale.
La conversion vocale est une technologie qui peut modifier le discours du locuteur source pour qu'il sonne comme la voix d'un autre locuteur cible.
Actuellement, un produit bien connu est so-vits-svc