Skip to Main Content

Ajuste fino de sentimientos en Dcard (Chino)

Experiencia en línea

Haga clic aquí

Resultados

Sin título

Sin título

截屏2023-05-15 11.53.39.png

截屏2023-05-15 11.54.39.png

Descripción de los datos

Dcard es un foro de la comunidad taiwanesa que organiza publicaciones en secciones temáticas. Este proyecto recolectó publicaciones de la sección de sentimientos de Dcard y ajustó finamente un modelo en LLaMA utilizando estos datos.

Breve introducción

Este proyecto recolectó datos de texto de la sección de sentimientos de Dcard, los convirtió en texto plano y luego ajustó finamente el modelo P01son/Linly-Chinese-LLaMA-7b-hf.

Tutorial

Ajuste fino del modelo

  1. Instalar text-generation-webui

    Siga la guía de instalación de text-generation-webui para instalarlo.

  2. Inicie text-generation-webui y seleccione la pestaña Modelo en las opciones superiores Sin título

  3. En la pestaña Modelo, ingrese P01son/Linly-Chinese-LLaMA-7b-hf, luego haga clic en Descargar para descargar el modelo base (también puede descargar manualmente el modelo y colocarlo en el directorio de modelos de la instalación de text-generation-webui) Sin título

  4. Descargue el conjunto de datos preparado de dcard y colóquelo en el directorio de entrenamiento/conjuntos de datos de la instalación de text-generation-webui

    Sin título

  5. Cambie a la pestaña de entrenamiento en text-generation-webui

    Sin título

  6. Seleccione el conjunto de datos de dcard

    Cambie a la opción Archivo de texto sin formato y seleccione el conjunto de datos de dcard

    Sin título

  7. Inicie el entrenamiento

    Utilice los parámetros predeterminados para el entrenamiento. Si desea aumentar la longitud del contexto, puede aumentar el parámetro de corte.

    Haga clic en Iniciar entrenamiento de LoRA para comenzar el entrenamiento.

    Puede ver el progreso del entrenamiento en text-generation-webui.

    Sin título

    Espere a que el modelo termine de entrenar. Esto suele tardar de 1 a 8 horas.

    La salida del proceso de entrenamiento se guarda en el directorio lora. También puede interrumpir el proceso de entrenamiento y utilizar el modelo de punto de control existente en el directorio lora.

    Sin título

  8. Utilice el modelo

    Cree manualmente una carpeta llamada dcard_m en el directorio lora.

    Copie el último modelo de punto de control de la carpeta al directorio lora.

    Sin título

Utilice el modelo ajustado finamente

  1. Cambie a la pestaña Modelo y seleccione primero el modelo Sin título

  2. Seleccione LoRA. Si LoRA no aparece, haga clic en el botón de actualización a la derecha o compruebe si el modelo LoRA se ha colocado en el directorio LoRA de text-generation-webui.

    Sin título

  3. Aplique LoRA haciendo clic en Aplicar los LoRAs seleccionados. Sin título

  4. Después de una aplicación exitosa, aparecerá una ventana de confirmación. Sin título

  5. Utilice el modelo

    Cambie a la pestaña Generación de texto, ingrese el comienzo de la historia y haga clic en Generar para generar automáticamente el resto de la historia a la derecha. Sin título