Audio AIGC Model

Derzeit gibt es keine guten grundlegenden Modelle im Audio-Bereich.

Grundlegendes Modell	Veröffentlichungsdatum	Herausgeber	Hinweis
dance-diffusion	2022.09	harmonai
audio-diffusion	2022.08	teticio
riffusion	2022.12	Seth Forsgren	Generiert ein Spektrum mit einem Diffusionsmodell und wandelt es in Musik um
audioldm	2023.01	haoheliu
bark	2023.04	suno.ai

Derzeit verfügbare Open-Source-Modelle haben eine gewisse Distanz zur Anwendung. Wenn Sie bessere Effekte erleben möchten, können Sie sich mubert ansehen.

Neben Modellen zur Generierung von Musik oder Klang aus dem Nichts ist eine weitere Technologie, die derzeit die Anwendungsschwelle erreicht, die Stimmumwandlung.

Stimmumwandlung ist eine Technologie, die die Sprache des Quellsprechers so ändern kann, dass sie wie die Stimme eines anderen Zielsprechers klingt.

Ein derzeit bekanntes Produkt ist so-vits-svc für Chinesisch.