Modelo de Audio AIGC
Actualmente, no hay buenos modelos básicos disponibles en el campo del audio.
Modelo Básico | Fecha de Lanzamiento | Editor | Nota |
---|---|---|---|
dance-diffusion | 2022.09 | harmonai | |
audio-diffusion | 2022.08 | teticio | |
riffusion | 2022.12 | Seth Forsgren | Genera un espectro utilizando un modelo de difusión y lo convierte en música |
audioldm | 2023.01 | haoheliu | |
bark | 2023.04 | suno.ai |
Los modelos de código abierto disponibles actualmente tienen cierta distancia de la aplicación. Si desea experimentar mejores efectos, puede echar un vistazo a mubert.
Además de los modelos para generar música o sonido desde cero, otra tecnología que actualmente se acerca al umbral de aplicación es la conversión de voz.
La conversión de voz es una tecnología que puede modificar el habla del hablante de origen para que suene como la voz de otro hablante objetivo.
Actualmente, un producto bien conocido es so-vits-svc