跳到主要内容

音频类AIGC模型

音频领域目前暂无较好的基础模型可用

基础模型发布时间发布者备注
dance-diffusion2022.09harmonai
audio-diffusion2022.08teticio
riffusion2022.12Seth Forsgren基于扩散模型生成频谱图,然后将频谱图转为音乐
audioldm2023.01haoheliu
bark2023.04suno.ai

目前开源的模型距离应用有一定的距离,如果你希望体验较好的效果,可以看一看 mubert

除了从头开始进行音乐或者声音生成的模型之外,另一种目前接近应用临界点的技术是语音转换

语音转换是一种技术,可以修改源说话人的语音,使他们的语音听起来像另一个目标说话人的声音

目前较为知名的产品有