テキストデータ
ファインチューニングモデルのトレーニングには、対話データ、コマンドデータ、純粋なテキストコーパスなど、独自のデータを準備する必要があります。
データの品質は、モデルのファインチューニングの効果に大きく影響します。
いくつかのデータを参考に提供しています。
📄️ Reddit Top 20K
Redditの過去のアーカイブデータを、サブレディットごとに分割してダウンロードおよび探索できるよう提供しています。
ファインチューニングモデルのトレーニングには、対話データ、コマンドデータ、純粋なテキストコーパスなど、独自のデータを準備する必要があります。
データの品質は、モデルのファインチューニングの効果に大きく影響します。
いくつかのデータを参考に提供しています。
Redditの過去のアーカイブデータを、サブレディットごとに分割してダウンロードおよび探索できるよう提供しています。