Données textuelles
Lors de l'entraînement de modèles affinés, vous devez préparer vos propres données, telles que des données de dialogue, des données de commande, un corpus de texte pur, etc.
La qualité des données affectera grandement l'efficacité de l'affinage du modèle.
Nous fournissons quelques données à titre de référence.
📄️ Reddit Top 20K
Nous fournissons des données d'archive historiques de Reddit partitionnées par subreddit pour votre téléchargement et exploration.