Foire aux questions
Différences entre les différents modèles AIGC
Actuellement, nous classons les modèles en trois catégories en fonction de leurs fonctionnalités : les modèles de texte, les modèles d'image et les modèles audio, qui correspondent respectivement à la génération de contenu textuel, visuel et auditif.
Qu'est-ce que les modèles de base ?
Les différences entre les différents modèles résident dans leurs poids et leurs structures de réseau. Si deux modèles ont la même structure de réseau mais des poids différents, ils appartiennent au même modèle de base. Pour les modèles d'optimisation légère tels que LoRA, ils ne sont compatibles qu'au sein du même modèle de base.
Téléchargement des résultats de prévisualisation du modèle
Pour faciliter la visualisation des performances du modèle, nous exigeons que les résultats de prévisualisation du modèle soient soumis lors du téléchargement d'un modèle.
Modèles de génération d'images
Si vous utilisez stable-diffusion-webui, par défaut, les images générées incluront des métadonnées sur les paramètres utilisés pour générer l'image.
Modèles de génération de texte
Vous devez télécharger une capture d'écran du texte généré, que nous convertirons en texte à l'aide de la reconnaissance optique de caractères (OCR). Cependant, si d'autres informations dans l'image interfèrent avec le texte, le résultat peut ne pas être précis et peut nécessiter une saisie manuelle de votre part.
Modèles de génération audio
Vous devez télécharger le fichier audio généré.