Skip to Main Content

Dcard Sentiment Fine-tuning (Chinese)

Online-Erfahrung

Klicken Sie hier

Ergebnisse

Untitled

Untitled

截屏2023-05-15 11.53.39.png

截屏2023-05-15 11.54.39.png

Datenbeschreibung

Dcard ist ein taiwanesisches Community-Forum, das Beiträge in Themenbereiche gliedert. In diesem Projekt wurden Beiträge aus dem Sentiment-Bereich von Dcard gesammelt und ein Modell auf LLaMA mit diesen Daten verfeinert.

Kurze Einführung

In diesem Projekt wurden Textdaten aus dem Sentiment-Bereich von Dcard gesammelt, in Klartext konvertiert und dann das P01son/Linly-Chinese-LLaMA-7b-hf-Modell verfeinert.

Tutorial

Modell verfeinern

  1. Installieren Sie text-generation-webui

    Folgen Sie der Installationsanleitung für text-generation-webui, um es zu installieren.

  2. Starten Sie text-generation-webui und wählen Sie die Registerkarte "Modell" aus den oberen Optionen aus. Untitled

  3. Geben Sie in der Modellregisterkarte P01son/Linly-Chinese-LLaMA-7b-hf ein und klicken Sie dann auf Download, um das Basismodell herunterzuladen (Sie können das Modell auch manuell herunterladen und in das Verzeichnis "models" der text-generation-webui-Installation kopieren). Untitled

  4. Laden Sie den vorbereiteten dcard-Datensatz herunter und legen Sie ihn im Verzeichnis "training/datasets" der text-generation-webui-Installation ab.

    Untitled

  5. Wechseln Sie zur Registerkarte "Training" in text-generation-webui.

    Untitled

  6. Wählen Sie den dcard-Datensatz aus.

    Wechseln Sie zur Option "Rohdatei" und wählen Sie den dcard-Datensatz aus.

    Untitled

  7. Starten Sie das Training.

    Verwenden Sie die Standardparameter für das Training. Wenn Sie die Kontextlänge erhöhen möchten, können Sie den Cutoff-Parameter erhöhen.

    Klicken Sie auf "Start LoRA Training", um das Training zu starten.

    Sie können den Fortschritt des Trainings in text-generation-webui sehen.

    Untitled

    Warten Sie, bis das Modell das Training abgeschlossen hat. Dies dauert normalerweise 1-8 Stunden.

    Das Ergebnis des Trainingprozesses wird im Verzeichnis "lora" gespeichert. Sie können auch den Trainingsprozess unterbrechen und das vorhandene Checkpoint-Modell im Verzeichnis "lora" verwenden.

    Untitled

  8. Verwenden Sie das Modell.

    Erstellen Sie manuell einen Ordner namens "dcard_m" im Verzeichnis "lora".

    Kopieren Sie das neueste Checkpoint-Modell aus dem Ordner in das Verzeichnis "lora".

    Untitled

Verwendung des verfeinerten Modells

  1. Wechseln Sie zur Modellregisterkarte und wählen Sie zuerst das Modell aus. Untitled

  2. Wählen Sie LoRA aus. Wenn LoRA nicht angezeigt wird, klicken Sie auf die Schaltfläche "Aktualisieren" auf der rechten Seite oder prüfen Sie, ob das LoRA-Modell im LoRA-Verzeichnis von text-generation-webui platziert wurde.

    Untitled

  3. Wenden Sie LoRA an, indem Sie auf "Ausgewählte LoRAs anwenden" klicken. Untitled

  4. Nach erfolgreicher Anwendung wird eine Meldung angezeigt. Untitled

  5. Verwenden Sie das Modell.

    Wechseln Sie zur Registerkarte "Textgenerierung", geben Sie den Anfang der Geschichte ein und klicken Sie auf "Generieren", um den Rest der Geschichte automatisch auf der rechten Seite zu generieren. Untitled