Publicaciones emocionales de Dcard
No importa cómo cambien los tiempos, los chismes y los temas emocionales siempre jugarán un papel indispensable en la vida de las personas.
Dcard es una comunidad popular en Taiwán, compuesta por secciones y publicaciones. Dcard se divide en varias secciones como "emoción", "belleza", "estado de ánimo", etc. Cada sección tiene una variedad de publicaciones, y los usuarios pueden responder a ellas.
Recopilamos algunos datos del foro de Dcard y los ajustamos en el modelo LLama para construir una aplicación de muestra que puede generar publicaciones de Dcard. (La experiencia en línea solo admite un usuario a la vez. Si no está disponible, utilice la versión simplificada para la experiencia).
Genera tu primera publicación emocional de Dcard
Por favor, abre la página de experiencia en línea e introduce el comienzo de la historia, como "novia enojada".
Luego haz clic en Generar, y el modelo completará automáticamente la historia. Si no estás satisfecho con la trama de la historia, puedes detener la generación en cualquier momento, modificar la historia tú mismo y luego continuar la generación.
Puedes pensar en algunos comienzos de historias tú mismo, como "corte de energía, novio", "ayer", "hay algunos rumores en la escuela recientemente", etc., y el modelo completará la historia por ti.
Proceso de generación de texto
Tomando esta aplicación como ejemplo, experimentemos brevemente el proceso de generación de texto.
La lógica de la generación de texto es relativamente simple. Introduce el comienzo de la historia, como "novio", "novia", "recientemente", "...", y luego haz clic en el botón Generar debajo para empezar a generar. Si necesitas detener la generación, haz clic en el botón Detener y controla la longitud máxima generada a través del max_new_tokens a la derecha.
Ajuste de parámetros
Puedes ajustar los parámetros para hacer que los resultados generados sean diferentes.
Cambia a la pestaña Parámetros.
Ajustando estos parámetros, puedes controlar la diversidad de los textos generados.
Los significados específicos de los parámetros se muestran en la tabla a continuación.
Parámetro | Función | Explicación |
---|---|---|
semilla | Semilla aleatoria | |
temperatura | El factor principal que controla la aleatoriedad de la salida | 0 = determinismo (solo usa el token más probable) Valores más altos = más aleatoriedad |
Top-P | Un factor que controla la aleatoriedad de la salida | Si se establece en float <1, solo se retienen para la generación el conjunto mínimo de probabilidades que suman Top-K o más de los tokens más probables Valores más altos = un rango más amplio de posibles resultados aleatorios |
Top-K | Un factor que controla la aleatoriedad de la salida | Selecciona la siguiente palabra de una lista de las k palabras siguientes más probables. Si Top-K se establece en 10, solo elegirá entre las 10 posibilidades más probables. |
typical_p | Un factor que controla la aleatoriedad de la salida | Cuando se establece el parámetro "typical_p" en un valor menor que 1, el algoritmo selecciona tokens que aparecen más a menudo que los tokens aleatorios basados en el contenido de texto anterior. Esto se puede usar para filtrar algunos tokens menos comunes o irrelevantes y seleccionar solo aquellos que son más significativos o relevantes. Cuando el parámetro "typical_p" se establece en 1, se seleccionan todos los tokens independientemente de su probabilidad relativa a los tokens aleatorios. |
penalización_de_repetición | Un parámetro que controla la repetición de la salida | 1 significa ninguna penalización Valores más altos = menos repetición Valores más bajos = más repetición |
penalización_de_repetición_del_codificador | Un parámetro que afecta la coherencia entre el texto generado y el texto anterior | 1.0 significa ninguna penalización Cuanto mayor sea el valor, más probable es que se mantenga en el contexto relacionado con el texto anterior; Cuanto menor sea el valor, más probable es que se desvíe del contexto relacionado con el texto anterior. |
tamaño_de_ngrama_sin_repetición | Un parámetro que controla si se permiten fragmentos repetidos en el texto generado | Valores más altos evitarán que aparezcan frases más largas repetidamente en el texto generado, lo que hará que el texto generado sea más diverso. Valores más bajos evitarán la repetición de palabras o letras, lo que hará que el texto generado sea más único. |
longitud_mínima | La longitud mínima del texto generado |