Audio AIGC Model
Derzeit gibt es keine guten grundlegenden Modelle im Audio-Bereich.
Grundlegendes Modell | Veröffentlichungsdatum | Herausgeber | Hinweis |
---|---|---|---|
dance-diffusion | 2022.09 | harmonai | |
audio-diffusion | 2022.08 | teticio | |
riffusion | 2022.12 | Seth Forsgren | Generiert ein Spektrum mit einem Diffusionsmodell und wandelt es in Musik um |
audioldm | 2023.01 | haoheliu | |
bark | 2023.04 | suno.ai |
Derzeit verfügbare Open-Source-Modelle haben eine gewisse Distanz zur Anwendung. Wenn Sie bessere Effekte erleben möchten, können Sie sich mubert ansehen.
Neben Modellen zur Generierung von Musik oder Klang aus dem Nichts ist eine weitere Technologie, die derzeit die Anwendungsschwelle erreicht, die Stimmumwandlung.
Stimmumwandlung ist eine Technologie, die die Sprache des Quellsprechers so ändern kann, dass sie wie die Stimme eines anderen Zielsprechers klingt.
Ein derzeit bekanntes Produkt ist so-vits-svc für Chinesisch.