Textdaten
Wenn Sie feinabgestimmte Modelle trainieren möchten, müssen Sie Ihre eigenen Daten vorbereiten, wie z.B. Dialogdaten, Befehlsdaten, reine Textkorpora usw.
Die Qualität der Daten beeinflusst die Effektivität der Feinabstimmung des Modells erheblich.
Wir stellen Ihnen einige Daten zur Verfügung, die Sie als Referenz verwenden können.
📄️ Reddit Top 20K
Wir stellen historische Archivdaten von Reddit bereit, die nach Subreddit für den Download und die Exploration partitioniert sind.