Skip to Main Content

Publicación de Reddit Crush

Experiencia en línea

Experiencia en línea simplificada

Reddit es la comunidad más popular en Internet, organizada en grupos de temas más pequeños llamados subreddits, cada uno con varias publicaciones en las que los usuarios pueden responder.

Recopilamos datos de algunos temas de Reddit Crush y los ajustamos en el modelo LLama, creando una aplicación de muestra para generar publicaciones de Reddit. (La experiencia en línea solo admite un usuario a la vez. Si no puede usarla, intente la versión simplificada).

Genera tu primera publicación de Reddit Crush

Por favor, abre la página de experiencia en línea, ingresa el comienzo de tu historia, como "Me encuentro."

Untitled

Luego haz clic en Generar, y el modelo completará automáticamente el resto de la historia. Si no estás satisfecho con la trama, puedes detener la generación en cualquier momento, modificar la historia tú mismo y continuar generando.

Untitled

Puedes inventar cualquier comienzo de historia que desees, como "ayer" o "recientemente", y el modelo completará la historia por ti.

Proceso de generación de texto

Usando esta aplicación como ejemplo, experimentemos el proceso de generación de texto.

La lógica de la generación de texto es relativamente simple: ingresa el comienzo de tu historia y el modelo continuará escribiéndola. Puedes pausar la generación en cualquier momento, modificar la historia y luego continuar generando.

Generación de texto

Primero, al generar texto, necesitamos dar una apertura como entrada, como "ayer", "Este lindo polluelo", "..." y así sucesivamente. Luego haz clic en el botón Generar debajo para comenzar a generar. Si necesitas detener la generación, haz clic en el botón Detener. Usa el max_new_tokens en la parte derecha para controlar la longitud máxima del texto generado.

Untitled

Ajuste de parámetros

Puedes ajustar los parámetros para producir diferentes resultados.

Cambia a la pestaña Parámetros.

Untitled

Al ajustar estos parámetros, puedes controlar la diversidad del texto generado.

Los significados específicos de los parámetros se muestran en la tabla a continuación.

ParámetroFunciónExplicación
seedSemilla aleatoria
temperatureFactor principal que controla la aleatoriedad de salida0 = determinismo (solo usa el token más probable)
Valores más altos = más aleatoriedad
Top-PFactor que controla la aleatoriedad de salidaSi se establece en un flotante <1, solo se retienen el conjunto mínimo de probabilidades que suman Top-K o más de los tokens más probables para la generación.
Valores más altos = una gama más amplia de resultados aleatorios posibles.
Top-KFactor que controla la aleatoriedad de salidaElije la siguiente palabra de una lista de las k palabras siguientes más probables. Si Top-K se establece en 10, solo elegirá entre las 10 posibilidades más probables.
typical_pFactor que controla la aleatoriedad de salidaCuando se establece el parámetro "typical_p" en un valor menor que 1, el algoritmo selecciona tokens que aparecen con más frecuencia que los tokens aleatorios en función del contenido de texto anterior. Esto se puede usar para filtrar algunos tokens menos comunes o irrelevantes y solo seleccionar aquellos que son más significativos o relevantes. Cuando el parámetro "typical_p" se establece en 1, se seleccionan todos los tokens independientemente de su probabilidad relativa con tokens aleatorios.
repetition_penaltyParámetro que controla la repetición de salida1 significa sin penalización
Valores más altos = menos repetición
Valores más bajos = más repetición
encoder_repetition_penaltyAfecta la coherencia entre el texto generado y el texto anterior1.0 significa sin penalización
Valores más altos indican una mayor tendencia a permanecer en contexto relacionado con el texto anterior;
Valores más bajos lo hacen más fácil para desviarse del contexto relacionado con el texto anterior.
no_repeat_ngram_sizeControla si se permiten fragmentos repetidos en el texto generadoValores más altos evitan que aparezcan frases más largas repetidamente en el texto generado, lo que hace que el texto generado sea más diverso.
Valores más bajos evitan la repetición de palabras o letras, lo que hace que el texto generado sea más único.
min_lengthLongitud mínima del texto generado