Publicación de Reddit Crush
Reddit es la comunidad más popular en Internet, organizada en grupos de temas más pequeños llamados subreddits, cada uno con varias publicaciones en las que los usuarios pueden responder.
Recopilamos datos de algunos temas de Reddit Crush y los ajustamos en el modelo LLama, creando una aplicación de muestra para generar publicaciones de Reddit. (La experiencia en línea solo admite un usuario a la vez. Si no puede usarla, intente la versión simplificada).
Genera tu primera publicación de Reddit Crush
Por favor, abre la página de experiencia en línea, ingresa el comienzo de tu historia, como "Me encuentro."
Luego haz clic en Generar, y el modelo completará automáticamente el resto de la historia. Si no estás satisfecho con la trama, puedes detener la generación en cualquier momento, modificar la historia tú mismo y continuar generando.
Puedes inventar cualquier comienzo de historia que desees, como "ayer" o "recientemente", y el modelo completará la historia por ti.
Proceso de generación de texto
Usando esta aplicación como ejemplo, experimentemos el proceso de generación de texto.
La lógica de la generación de texto es relativamente simple: ingresa el comienzo de tu historia y el modelo continuará escribiéndola. Puedes pausar la generación en cualquier momento, modificar la historia y luego continuar generando.
Generación de texto
Primero, al generar texto, necesitamos dar una apertura como entrada, como "ayer", "Este lindo polluelo", "..." y así sucesivamente. Luego haz clic en el botón Generar debajo para comenzar a generar. Si necesitas detener la generación, haz clic en el botón Detener. Usa el max_new_tokens en la parte derecha para controlar la longitud máxima del texto generado.
Ajuste de parámetros
Puedes ajustar los parámetros para producir diferentes resultados.
Cambia a la pestaña Parámetros.
Al ajustar estos parámetros, puedes controlar la diversidad del texto generado.
Los significados específicos de los parámetros se muestran en la tabla a continuación.
Parámetro | Función | Explicación |
---|---|---|
seed | Semilla aleatoria | |
temperature | Factor principal que controla la aleatoriedad de salida | 0 = determinismo (solo usa el token más probable) Valores más altos = más aleatoriedad |
Top-P | Factor que controla la aleatoriedad de salida | Si se establece en un flotante <1, solo se retienen el conjunto mínimo de probabilidades que suman Top-K o más de los tokens más probables para la generación. Valores más altos = una gama más amplia de resultados aleatorios posibles. |
Top-K | Factor que controla la aleatoriedad de salida | Elije la siguiente palabra de una lista de las k palabras siguientes más probables. Si Top-K se establece en 10, solo elegirá entre las 10 posibilidades más probables. |
typical_p | Factor que controla la aleatoriedad de salida | Cuando se establece el parámetro "typical_p" en un valor menor que 1, el algoritmo selecciona tokens que aparecen con más frecuencia que los tokens aleatorios en función del contenido de texto anterior. Esto se puede usar para filtrar algunos tokens menos comunes o irrelevantes y solo seleccionar aquellos que son más significativos o relevantes. Cuando el parámetro "typical_p" se establece en 1, se seleccionan todos los tokens independientemente de su probabilidad relativa con tokens aleatorios. |
repetition_penalty | Parámetro que controla la repetición de salida | 1 significa sin penalización Valores más altos = menos repetición Valores más bajos = más repetición |
encoder_repetition_penalty | Afecta la coherencia entre el texto generado y el texto anterior | 1.0 significa sin penalización Valores más altos indican una mayor tendencia a permanecer en contexto relacionado con el texto anterior; Valores más bajos lo hacen más fácil para desviarse del contexto relacionado con el texto anterior. |
no_repeat_ngram_size | Controla si se permiten fragmentos repetidos en el texto generado | Valores más altos evitan que aparezcan frases más largas repetidamente en el texto generado, lo que hace que el texto generado sea más diverso. Valores más bajos evitan la repetición de palabras o letras, lo que hace que el texto generado sea más único. |
min_length | Longitud mínima del texto generado |