Skip to Main Content

Reddit Crushes Post Fine-tune

Expérience en ligne

Reddit Crush en ligne

Résultats

Untitled

Untitled2

Untitled3

Description des données

Les données d'entraînement proviennent du subreddit Reddit Crushes

Tous les posts sous le sujet Crushes ont été collectés.

Brève introduction

Collectez les données de post de Reddit Crush, convertissez-les en données de texte brut et entraînez-les en utilisant le modèle TheBloke/Wizard-Vicuna-7B-Uncensored-HF.

Tutoriel

Entraînement du modèle Fine-Tune

  1. Installer text-generation-webui

    Suivez le guide d'installation de text-generation-webui pour installer text-generation-webui.

  2. Démarrer text-generation-webui, sélectionnez Modèle dans l'onglet supérieur Untitled

  3. Dans l'onglet Modèle, entrez TheBloke/Wizard-Vicuna-7B-Uncensored-HF, puis cliquez sur Télécharger pour télécharger le modèle de base (vous pouvez également télécharger manuellement le modèle et le placer dans le répertoire models du répertoire d'installation de text-generation-webui). Untitled

  4. Téléchargez l'ensemble de données préparé reddit crush dataset et placez l'ensemble de données dans le répertoire training/datasets du répertoire d'installation de text-generation-webui.

    Untitled

  5. Basculer vers l'onglet d'entraînement de text-generation-webui

    Untitled

  6. Sélectionnez l'ensemble de données reddit crush

    Basculez vers le fichier texte brut et sélectionnez l'ensemble de données reddit crush

    Untitled

  7. Démarrer l'entraînement

    Utilisez les paramètres par défaut pour l'entraînement. Si vous souhaitez augmenter la longueur du contexte, vous pouvez augmenter le paramètre de coupure.

    Cliquez sur Démarrer LoRA Training pour démarrer l'entraînement.

    Après le démarrage de l'entraînement, vous pouvez voir la progression de l'entraînement dans text-generation-webui.

    Untitled

    Attendez que l'entraînement du modèle soit terminé. Cela prend généralement de 1 à 8 heures.

    Le produit du processus d'entraînement est enregistré dans le répertoire lora. Vous pouvez également interrompre l'entraînement en cours de route et utiliser le modèle de point de contrôle existant dans le répertoire lora.

    Untitled

  8. Utiliser le modèle

    Créez manuellement un dossier nommé reddit_crush dans le répertoire lora.

    Copiez le dernier modèle de point de contrôle du dossier dans le répertoire lora.

    Untitled

Utiliser le modèle Fine-Tune

  1. Basculez vers l'onglet Modèle, et d'abord sélectionnez Modèle Untitled

  2. Sélectionnez LoRA. Si le choix de Lora n'apparaît pas, veuillez cliquer sur le bouton de rafraîchissement à droite ou vérifier si le modèle LoRA a été placé dans le répertoire LoRA de text-generation-webui.

    Untitled

  3. Appliquer LoRA, cliquez sur Appliquer les LoRA sélectionnés Untitled

  4. Après l'application réussie, vous pouvez voir la notification Untitled

  5. Utiliser le modèle

    Basculez vers l'onglet Génération de texte, puis saisissez le début de l'histoire, cliquez sur Générer, et la suite de l'histoire sera automatiquement générée sur le côté droit. Untitled