Skip to Main Content

Ajuste fino de publicaciones de Reddit

Experiencia en línea

Reddit Crush en línea

Resultados

Sin título

Sin título2

Sin título3

Descripción de los datos

Los datos de entrenamiento provienen del subreddit Reddit Crushes

Se recopilaron todas las publicaciones bajo el tema Crushes.

Breve introducción

Recopile datos de publicaciones de Reddit Crush, conviértalos en datos de texto plano y ajuste el entrenamiento en el modelo TheBloke/Wizard-Vicuna-7B-Uncensored-HF.

Tutorial

Entrenar el modelo de ajuste fino

  1. Instale text-generation-webui

    Siga la guía de instalación de text-generation-webui para instalar text-generation-webui.

  2. Inicie text-generation-webui, seleccione Modelo desde la pestaña superior. Sin título

  3. En la pestaña Modelo, ingrese TheBloke/Wizard-Vicuna-7B-Uncensored-HF, y luego haga clic en Descargar para descargar el modelo base (también puede descargar manualmente el modelo y colocarlo en el directorio de modelos de la instalación de text-generation-webui). Sin título

  4. Descargue el conjunto de datos de crush de Reddit preparado reddit crush dataset y coloque el conjunto de datos en el directorio training/datasets del directorio de instalación de text-generation-webui.

    Sin título

  5. Cambie a la pestaña de entrenamiento de text-generation-webui

    Sin título

  6. Seleccione el conjunto de datos de crush de Reddit

    Cambie a Archivo de texto sin formato y seleccione el conjunto de datos de crush de Reddit

    Sin título

  7. Inicie el entrenamiento

    Use los parámetros predeterminados para el entrenamiento. Si desea aumentar la longitud del contexto, puede aumentar el parámetro de corte.

    Haga clic en Iniciar entrenamiento de LoRA para comenzar el entrenamiento.

    Después de que comience el entrenamiento, puede ver el progreso del entrenamiento en text-generation-webui.

    Sin título

    Espere a que el entrenamiento del modelo se complete. Por lo general, esto tomará de 1 a 8 horas.

    El producto del proceso de entrenamiento se guarda en el directorio lora. También puede interrumpir el entrenamiento a mitad de camino y usar el modelo de punto de control existente en el directorio lora.

    Sin título

  8. Use el modelo

    Cree manualmente una carpeta llamada reddit_crush en el directorio lora.

    Copie el último modelo de punto de control de la carpeta al directorio lora.

    Sin título

Usar el modelo de ajuste fino

  1. Cambie a la pestaña Modelo y seleccione Modelo primero. Sin título

  2. Seleccione LoRA. Si no aparece la elección de Lora, haga clic en el botón de actualización a la derecha o verifique si el modelo LoRA se ha colocado en el directorio LoRA de text-generation-webui.

    Sin título

  3. Aplique LoRA, haga clic en Aplicar los LoRAs seleccionados Sin título

  4. Después de que la aplicación sea exitosa, puede ver la ventana de confirmación Sin título

  5. Use el modelo

    Cambie a la pestaña Generación de texto, luego genere la introducción de la historia, haga clic en Generar, y la continuación de la historia se generará automáticamente en el lado derecho. Sin título