Skip to Main Content

Modelo de Audio AIGC

Actualmente, no hay buenos modelos básicos disponibles en el campo del audio.

Modelo BásicoFecha de LanzamientoEditorNota
dance-diffusion2022.09harmonai
audio-diffusion2022.08teticio
riffusion2022.12Seth ForsgrenGenera un espectro utilizando un modelo de difusión y lo convierte en música
audioldm2023.01haoheliu
bark2023.04suno.ai

Los modelos de código abierto disponibles actualmente tienen cierta distancia de la aplicación. Si desea experimentar mejores efectos, puede echar un vistazo a mubert.

Además de los modelos para generar música o sonido desde cero, otra tecnología que actualmente se acerca al umbral de aplicación es la conversión de voz.

La conversión de voz es una tecnología que puede modificar el habla del hablante de origen para que suene como la voz de otro hablante objetivo.

Actualmente, un producto bien conocido es so-vits-svc