跳到主要内容

音频类AIGC模型

音频领域目前暂无较好的基础模型可用

基础模型	发布时间	发布者	备注
dance-diffusion	2022.09	harmonai
audio-diffusion	2022.08	teticio
riffusion	2022.12	Seth Forsgren	基于扩散模型生成频谱图，然后将频谱图转为音乐
audioldm	2023.01	haoheliu
bark	2023.04	suno.ai

目前开源的模型距离应用有一定的距离，如果你希望体验较好的效果，可以看一看 mubert

除了从头开始进行音乐或者声音生成的模型之外，另一种目前接近应用临界点的技术是语音转换

语音转换是一种技术，可以修改源说话人的语音，使他们的语音听起来像另一个目标说话人的声音

目前较为知名的产品有