Skip to Main Content

Publicaciones emocionales de Dcard

No importa cómo cambien los tiempos, los chismes y los temas emocionales siempre jugarán un papel indispensable en la vida de las personas.

Dcard es una comunidad popular en Taiwán, compuesta por secciones y publicaciones. Dcard se divide en varias secciones como "emoción", "belleza", "estado de ánimo", etc. Cada sección tiene una variedad de publicaciones, y los usuarios pueden responder a ellas.

Recopilamos algunos datos del foro de Dcard y los ajustamos en el modelo LLama para construir una aplicación de muestra que puede generar publicaciones de Dcard. (La experiencia en línea solo admite un usuario a la vez. Si no está disponible, utilice la versión simplificada para la experiencia).

Experiencia en línea

Experiencia en línea simplificada

Genera tu primera publicación emocional de Dcard

Por favor, abre la página de experiencia en línea e introduce el comienzo de la historia, como "novia enojada".

Untitled

Luego haz clic en Generar, y el modelo completará automáticamente la historia. Si no estás satisfecho con la trama de la historia, puedes detener la generación en cualquier momento, modificar la historia tú mismo y luego continuar la generación.

Untitled

Puedes pensar en algunos comienzos de historias tú mismo, como "corte de energía, novio", "ayer", "hay algunos rumores en la escuela recientemente", etc., y el modelo completará la historia por ti.

Proceso de generación de texto

Tomando esta aplicación como ejemplo, experimentemos brevemente el proceso de generación de texto.

La lógica de la generación de texto es relativamente simple. Introduce el comienzo de la historia, como "novio", "novia", "recientemente", "...", y luego haz clic en el botón Generar debajo para empezar a generar. Si necesitas detener la generación, haz clic en el botón Detener y controla la longitud máxima generada a través del max_new_tokens a la derecha.

Untitled

Ajuste de parámetros

Puedes ajustar los parámetros para hacer que los resultados generados sean diferentes.

Cambia a la pestaña Parámetros.

Untitled

Ajustando estos parámetros, puedes controlar la diversidad de los textos generados.

Los significados específicos de los parámetros se muestran en la tabla a continuación.

ParámetroFunciónExplicación
semillaSemilla aleatoria
temperaturaEl factor principal que controla la aleatoriedad de la salida0 = determinismo (solo usa el token más probable)
Valores más altos = más aleatoriedad
Top-PUn factor que controla la aleatoriedad de la salidaSi se establece en float <1, solo se retienen para la generación el conjunto mínimo de probabilidades que suman Top-K o más de los tokens más probables
Valores más altos = un rango más amplio de posibles resultados aleatorios
Top-KUn factor que controla la aleatoriedad de la salidaSelecciona la siguiente palabra de una lista de las k palabras siguientes más probables. Si Top-K se establece en 10, solo elegirá entre las 10 posibilidades más probables.
typical_pUn factor que controla la aleatoriedad de la salidaCuando se establece el parámetro "typical_p" en un valor menor que 1, el algoritmo selecciona tokens que aparecen más a menudo que los tokens aleatorios basados en el contenido de texto anterior. Esto se puede usar para filtrar algunos tokens menos comunes o irrelevantes y seleccionar solo aquellos que son más significativos o relevantes. Cuando el parámetro "typical_p" se establece en 1, se seleccionan todos los tokens independientemente de su probabilidad relativa a los tokens aleatorios.
penalización_de_repeticiónUn parámetro que controla la repetición de la salida1 significa ninguna penalización
Valores más altos = menos repetición
Valores más bajos = más repetición
penalización_de_repetición_del_codificadorUn parámetro que afecta la coherencia entre el texto generado y el texto anterior1.0 significa ninguna penalización
Cuanto mayor sea el valor, más probable es que se mantenga en el contexto relacionado con el texto anterior;
Cuanto menor sea el valor, más probable es que se desvíe del contexto relacionado con el texto anterior.
tamaño_de_ngrama_sin_repeticiónUn parámetro que controla si se permiten fragmentos repetidos en el texto generadoValores más altos evitarán que aparezcan frases más largas repetidamente en el texto generado, lo que hará que el texto generado sea más diverso.
Valores más bajos evitarán la repetición de palabras o letras, lo que hará que el texto generado sea más único.
longitud_mínimaLa longitud mínima del texto generado