Modelo de Audio AIGC

Actualmente, no hay buenos modelos básicos disponibles en el campo del audio.

Modelo Básico	Fecha de Lanzamiento	Editor	Nota
dance-diffusion	2022.09	harmonai
audio-diffusion	2022.08	teticio
riffusion	2022.12	Seth Forsgren	Genera un espectro utilizando un modelo de difusión y lo convierte en música
audioldm	2023.01	haoheliu
bark	2023.04	suno.ai

Los modelos de código abierto disponibles actualmente tienen cierta distancia de la aplicación. Si desea experimentar mejores efectos, puede echar un vistazo a mubert.

Además de los modelos para generar música o sonido desde cero, otra tecnología que actualmente se acerca al umbral de aplicación es la conversión de voz.

La conversión de voz es una tecnología que puede modificar el habla del hablante de origen para que suene como la voz de otro hablante objetivo.

Actualmente, un producto bien conocido es so-vits-svc