音频类AIGC模型
音频领域目前暂无较好的基础模型可用
基础模型 | 发布时间 | 发布者 | 备注 |
---|---|---|---|
dance-diffusion | 2022.09 | harmonai | |
audio-diffusion | 2022.08 | teticio | |
riffusion | 2022.12 | Seth Forsgren | 基于扩散模型生成频谱图,然后将频谱图转为音乐 |
audioldm | 2023.01 | haoheliu | |
bark | 2023.04 | suno.ai |
目前开源的模型距离应用有一定的距离,如果你希望体验较好的效果,可以看一看 mubert
除了从头开始进行音乐或者声音生成的模型之外,另一种目前接近应用临界点的技术是语音转换
语音转换是一种技术,可以修改源说话人的语音,使他们的语音听起来像另一个目标说话人的声音
目前较为知名的产品有