Skip to Main Content

オーディオ AIGC モデル

現在、オーディオ分野で利用できる優れたベースモデルはありません。

基本モデル発売日出版社ノート
dance-diffusion2022.09harmonai
audio-diffusion2022.08teticio
riffusion2022.12Seth Forsgren拡散モデルに基づいてスペクトログラムを生成し、そのスペクトログラムを音楽に変換します
audioldm2023.01haoheliu
bark2023.04suno.ai

現在利用可能なオープンソース モデルとアプリケーションの間には、依然として一定の距離があります。 より良い結果を得たい場合は、mubert をご覧ください。

音楽や音声をゼロから生成するモデルに加えて、現在応用の敷居に近づいているもう 1 つのテクノロジーが 音声変換 です。

音声変換は、ソース話者の音声を変更して、別のターゲット話者のように聞こえるようにする技術です。

現在、よく知られている製品は so-vits-svc です。