Skip to Main Content

Foire aux questions

Différences entre les différents modèles AIGC

Actuellement, nous classons les modèles en trois catégories en fonction de leurs fonctionnalités : les modèles de texte, les modèles d'image et les modèles audio, qui correspondent respectivement à la génération de contenu textuel, visuel et auditif.

Qu'est-ce que les modèles de base ?

Les différences entre les différents modèles résident dans leurs poids et leurs structures de réseau. Si deux modèles ont la même structure de réseau mais des poids différents, ils appartiennent au même modèle de base. Pour les modèles d'optimisation légère tels que LoRA, ils ne sont compatibles qu'au sein du même modèle de base.

Téléchargement des résultats de prévisualisation du modèle

Pour faciliter la visualisation des performances du modèle, nous exigeons que les résultats de prévisualisation du modèle soient soumis lors du téléchargement d'un modèle.

Modèles de génération d'images

Si vous utilisez stable-diffusion-webui, par défaut, les images générées incluront des métadonnées sur les paramètres utilisés pour générer l'image.

Modèles de génération de texte

Vous devez télécharger une capture d'écran du texte généré, que nous convertirons en texte à l'aide de la reconnaissance optique de caractères (OCR). Cependant, si d'autres informations dans l'image interfèrent avec le texte, le résultat peut ne pas être précis et peut nécessiter une saisie manuelle de votre part.

Modèles de génération audio

Vous devez télécharger le fichier audio généré.