ファインチューニングモデルの紹介

「ファインチューニングモデルは錬金術の究極の秘密です。」伝説の錬金術師イダル・アルケミーは「錬金術ハンドブック」で書きました。

ファインチューニングモデルの紹介

モデルのファインチューニングとは何でしょうか？

まず、いくつかの現実のシナリオを考えてみましょう。

ある有名人が好きで、その有名人の写真を生成するようにモデルに指示する方法を知りたい場合、どのようにしてその特定の有名人の写真を生成するようにモデルに指示できますか？
ロールプレイングゲームで、猫耳少女としてチャットボットがプレイするようにしたい場合、会話の中でこの猫耳少女に感情が芽生えた場合、新しい会話コンテキストを開始してチャットボットが再びこの猫耳少女としてプレイするようにした場合、チャットボットの話し方や性格が以前とは明らかに異なることがあります。チャットボットの話し方/性格が一貫していることを確認するにはどうすればよいですか？
友人Xが亡くなり、チャットボットにXを装ってチャットをするようにしたい場合、できるだけXに似せるために、複雑な背景設定をチャットボットに提供します。しかし、背景設定が長すぎるため、会話コンテキストの長さにより、チャットボットは前回の会話をしばしば忘れてしまいます。この問題をどのように解決できますか？

これらの3つのシナリオで直面する問題は、単にモデルの入力（プロンプト）を修正するだけでは解決できません。問題は以下のようなものです。

自然言語を通じて望ましい生成コンテンツを正確に説明することができない可能性がある。
たとえば、顔の場合、有名人の目が大きい、鼻筋が高い、黒髪などとモデルに伝えても、モデルはまだ正確にどのような人物を生成するかを決定することができません。人物の顔を自然言語で正確に説明することはできません。
単純な自然言語の説明では、モデルによって生成されるコンテンツが安定しないことが保証されない。
たとえば、ロールプレイングのシナリオでは、チャットボットに特定のキャラクターをプレイするように伝えます。テキストを通じてキャラクターの話し方や性格を説明しても、チャットボットの回答は複数のプレイや会話の中で私たちの設定とは異なる場合があります。
モデルの生成に対する単純なテキスト制約は通常、低い精度を持ちます。単純なテキストで人物を正確に説明することはできません。
モデルに対する単純なテキスト制約は、制限テキストの長さにより、会話が短すぎる場合があります。
自然言語の制約を通じて精度を向上させるためには、より長い自然言語の制約が必要です。自然言語制約が長いほど、対話コンテキストのスペースを占有し、実際の会話が短くなる可能性があります。

単純な入力調整ではこれらの問題を解決できない場合、モデルのファインチューニング技術が必要です。

モデルのファインチューニングとは、特定のデータに対して既存のモデルを再トレーニングし、特定のシナリオに適したモデルにすることを指します。

たとえば、上記のシナリオで直面する問題はすべて、モデルのファインチューニングによって解決できます。

自然言語を通じて望ましい生成コンテンツを正確に説明することができない可能性がある。
言語を通じて有名人の顔を説明することはできないため、その有名人の写真を使用して、モデルにどのような人物を生成するかを伝えることができます。
まず、オンラインで10〜40枚のクリアな顔写真を収集し、その後、これらの写真でモデルをファインチューニングします。ファインチューニング後、ファインチューニングされたモデルを使用して、この有名人の写真を生成することができます。
単純な自然言語の説明では、モデルによって生成されるコンテンツが安定しないことが保証されない。
まず、以前に好きだった猫耳少女のチャットデータを収集し、彼女の話し方を見つける必要があります。以前の会話データが十分でない場合は、チャットボットにこのスタイルを模倣したいくつかの言語を直接生成させ、適切なテキストを選び出します。その後、このテキストでモデルをファインチューニングし、ファインチューニングされたモデルはファインチューニングデータのスタイルに向かって傾くテキストを出力します。
モデルに対する単純なテキスト制約は、制限テキストの長さにより、会話が短すぎる場合があります。
まず、友人Xのチャット会話やキャラクターの背景など、いくつかのXのデータを用意する必要があります。その後、このテキストでモデルをファインチューニングし、ファインチューニングされたモデルは、複雑な背景設定なしでこのキャラクターのスタイルで直接会話することができます。

一般的に、ファインチューニングモデルの意義は、モデルによって生成されるコンテンツをよりカスタマイズすることです。

モデルのファインチューニングが必要ではない場合

たとえば、画像内のキャラクターがすべて白いTシャツを着ていることを指定したい場合、またはチャットボットが実用的な役割を果たすようにしたい場合、一般的には、カスタマイズされていないシナリオでは、ファインチューニングなしで一般的なモデルを使用できます。

ファインチューニングモデルの準備に必要なもの

機器: Nvidiaグラフィックスカードを搭載したコンピュータ（このような機器がない場合は、オンラインサービスをレンタルできます）

データ:

画像タイプの場合、いくつかの画像を用意する必要があります。
テキストタイプの場合、テキストコーパスを用意する必要があります。
音声タイプの場合、いくつかの音楽や歌のファイルを用意する必要があります。

ファインチューニングモデルの使用方法

ファインチューニングモデルの使用方法については、モデル使用概要の内容を参照してください。

ファインチューニングモデルの紹介