Ajuste fino de publicaciones de Reddit
Experiencia en línea
Resultados
Descripción de los datos
Los datos de entrenamiento provienen del subreddit Reddit Crushes
Se recopilaron todas las publicaciones bajo el tema Crushes.
Breve introducción
Recopile datos de publicaciones de Reddit Crush, conviértalos en datos de texto plano y ajuste el entrenamiento en el modelo TheBloke/Wizard-Vicuna-7B-Uncensored-HF.
Tutorial
Entrenar el modelo de ajuste fino
Instale text-generation-webui
Siga la guía de instalación de text-generation-webui para instalar text-generation-webui.
Inicie text-generation-webui, seleccione Modelo desde la pestaña superior.
En la pestaña Modelo, ingrese TheBloke/Wizard-Vicuna-7B-Uncensored-HF, y luego haga clic en Descargar para descargar el modelo base (también puede descargar manualmente el modelo y colocarlo en el directorio de modelos de la instalación de text-generation-webui).
Descargue el conjunto de datos de crush de Reddit preparado reddit crush dataset y coloque el conjunto de datos en el directorio training/datasets del directorio de instalación de text-generation-webui.
Cambie a la pestaña de entrenamiento de text-generation-webui
Seleccione el conjunto de datos de crush de Reddit
Cambie a Archivo de texto sin formato y seleccione el conjunto de datos de crush de Reddit
Inicie el entrenamiento
Use los parámetros predeterminados para el entrenamiento. Si desea aumentar la longitud del contexto, puede aumentar el parámetro de corte.
Haga clic en Iniciar entrenamiento de LoRA para comenzar el entrenamiento.
Después de que comience el entrenamiento, puede ver el progreso del entrenamiento en text-generation-webui.
Espere a que el entrenamiento del modelo se complete. Por lo general, esto tomará de 1 a 8 horas.
El producto del proceso de entrenamiento se guarda en el directorio lora. También puede interrumpir el entrenamiento a mitad de camino y usar el modelo de punto de control existente en el directorio lora.
Use el modelo
Cree manualmente una carpeta llamada reddit_crush en el directorio lora.
Copie el último modelo de punto de control de la carpeta al directorio lora.
Usar el modelo de ajuste fino
Cambie a la pestaña Modelo y seleccione Modelo primero.
Seleccione LoRA. Si no aparece la elección de Lora, haga clic en el botón de actualización a la derecha o verifique si el modelo LoRA se ha colocado en el directorio LoRA de text-generation-webui.
Aplique LoRA, haga clic en Aplicar los LoRAs seleccionados
Después de que la aplicación sea exitosa, puede ver la ventana de confirmación
Use el modelo
Cambie a la pestaña Generación de texto, luego genere la introducción de la historia, haga clic en Generar, y la continuación de la historia se generará automáticamente en el lado derecho.