Publicaciones emocionales de Dcard

No importa cómo cambien los tiempos, los chismes y los temas emocionales siempre jugarán un papel indispensable en la vida de las personas.

Dcard es una comunidad popular en Taiwán, compuesta por secciones y publicaciones. Dcard se divide en varias secciones como "emoción", "belleza", "estado de ánimo", etc. Cada sección tiene una variedad de publicaciones, y los usuarios pueden responder a ellas.

Recopilamos algunos datos del foro de Dcard y los ajustamos en el modelo LLama para construir una aplicación de muestra que puede generar publicaciones de Dcard. (La experiencia en línea solo admite un usuario a la vez. Si no está disponible, utilice la versión simplificada para la experiencia).

Experiencia en línea

Experiencia en línea simplificada

Genera tu primera publicación emocional de Dcard

Por favor, abre la página de experiencia en línea e introduce el comienzo de la historia, como "novia enojada".

Untitled

Luego haz clic en Generar, y el modelo completará automáticamente la historia. Si no estás satisfecho con la trama de la historia, puedes detener la generación en cualquier momento, modificar la historia tú mismo y luego continuar la generación.

Untitled

Puedes pensar en algunos comienzos de historias tú mismo, como "corte de energía, novio", "ayer", "hay algunos rumores en la escuela recientemente", etc., y el modelo completará la historia por ti.

Proceso de generación de texto

Tomando esta aplicación como ejemplo, experimentemos brevemente el proceso de generación de texto.

La lógica de la generación de texto es relativamente simple. Introduce el comienzo de la historia, como "novio", "novia", "recientemente", "...", y luego haz clic en el botón Generar debajo para empezar a generar. Si necesitas detener la generación, haz clic en el botón Detener y controla la longitud máxima generada a través del max_new_tokens a la derecha.

Untitled

Ajuste de parámetros

Puedes ajustar los parámetros para hacer que los resultados generados sean diferentes.

Cambia a la pestaña Parámetros.

Untitled

Ajustando estos parámetros, puedes controlar la diversidad de los textos generados.

Los significados específicos de los parámetros se muestran en la tabla a continuación.

Parámetro	Función	Explicación
semilla	Semilla aleatoria
temperatura	El factor principal que controla la aleatoriedad de la salida	0 = determinismo (solo usa el token más probable) Valores más altos = más aleatoriedad
Top-P	Un factor que controla la aleatoriedad de la salida	Si se establece en float <1, solo se retienen para la generación el conjunto mínimo de probabilidades que suman Top-K o más de los tokens más probables Valores más altos = un rango más amplio de posibles resultados aleatorios
Top-K	Un factor que controla la aleatoriedad de la salida	Selecciona la siguiente palabra de una lista de las k palabras siguientes más probables. Si Top-K se establece en 10, solo elegirá entre las 10 posibilidades más probables.
typical_p	Un factor que controla la aleatoriedad de la salida	Cuando se establece el parámetro "typical_p" en un valor menor que 1, el algoritmo selecciona tokens que aparecen más a menudo que los tokens aleatorios basados en el contenido de texto anterior. Esto se puede usar para filtrar algunos tokens menos comunes o irrelevantes y seleccionar solo aquellos que son más significativos o relevantes. Cuando el parámetro "typical_p" se establece en 1, se seleccionan todos los tokens independientemente de su probabilidad relativa a los tokens aleatorios.
penalización_de_repetición	Un parámetro que controla la repetición de la salida	1 significa ninguna penalización Valores más altos = menos repetición Valores más bajos = más repetición
penalización_de_repetición_del_codificador	Un parámetro que afecta la coherencia entre el texto generado y el texto anterior	1.0 significa ninguna penalización Cuanto mayor sea el valor, más probable es que se mantenga en el contexto relacionado con el texto anterior; Cuanto menor sea el valor, más probable es que se desvíe del contexto relacionado con el texto anterior.
tamaño_de_ngrama_sin_repetición	Un parámetro que controla si se permiten fragmentos repetidos en el texto generado	Valores más altos evitarán que aparezcan frases más largas repetidamente en el texto generado, lo que hará que el texto generado sea más diverso. Valores más bajos evitarán la repetición de palabras o letras, lo que hará que el texto generado sea más único.
longitud_mínima	La longitud mínima del texto generado

Publicaciones emocionales de Dcard

Genera tu primera publicación emocional de Dcard​

Proceso de generación de texto​

Ajuste de parámetros​

Genera tu primera publicación emocional de Dcard

Proceso de generación de texto

Ajuste de parámetros