Skip to Main Content

Publication d'émotions sur Dcard

Peu importe comment les temps changent, les potins et les sujets émotionnels joueront toujours un rôle indispensable dans la vie des gens.

Dcard est une communauté populaire à Taïwan, composée de sections et de publications. Dcard est divisé en différentes sections telles que "émotion", "beauté", "humeur", etc. Chaque section a une variété de publications et les utilisateurs peuvent y répondre.

Nous avons collecté des données sur le forum Dcard et les avons affinées sur le modèle LLama pour construire une application d'exemple qui peut générer des publications Dcard. (L'expérience en ligne ne prend en charge qu'un utilisateur à la fois. Si elle n'est pas disponible, veuillez utiliser la version simplifiée pour l'expérience.)

Expérience en ligne

Expérience en ligne simplifiée

Générez votre première publication émotionnelle sur Dcard

Veuillez ouvrir la page d'expérience en ligne et entrer le début de l'histoire, tel que "ma petite amie est en colère".

Untitled

Ensuite, cliquez sur Générer, et le modèle complétera automatiquement l'histoire. Si vous n'êtes pas satisfait de l'intrigue de l'histoire, vous pouvez arrêter la génération à tout moment, modifier l'histoire vous-même, puis continuer la génération.

Untitled

Vous pouvez penser à quelques débuts d'histoire vous-même, tels que "panne de courant, petit ami", "hier", "il y a quelques rumeurs à l'école récemment", etc., et le modèle complétera l'histoire pour vous.

Processus de génération de texte

En prenant cette application comme exemple, expérimentons brièvement le processus de génération de texte.

La logique de la génération de texte est relativement simple. Entrez le début de l'histoire, tel que "petit ami", "petite amie", "récemment", "...", puis cliquez sur le bouton Générer ci-dessous pour commencer la génération. Si vous avez besoin d'arrêter la génération, cliquez sur le bouton Arrêter et contrôlez la longueur maximale générée grâce à max_new_tokens sur la droite.

Untitled

Ajustement des paramètres

Vous pouvez ajuster les paramètres pour rendre les résultats générés différents.

Passez à l'onglet Paramètres.

Untitled

En ajustant ces paramètres, vous pouvez contrôler la diversité des textes générés.

Les significations spécifiques des paramètres sont indiquées dans le tableau ci-dessous.

ParamètreFonctionExplication
seedGraine aléatoire
temperatureLe principal facteur qui contrôle l'aléatoire de la sortie0 = déterminisme (utilisez uniquement le jeton le plus probable)
Des valeurs plus élevées = plus d'aléatoire
Top-PUn facteur qui contrôle l'aléatoire de la sortieSi défini sur float <1, seuls le minimum d'ensemble de probabilités qui s'ajoutent à Top-K ou plus des jetons les plus probables sont conservés pour la génération
Des valeurs plus élevées = une plus large gamme de résultats aléatoires possibles
Top-KUn facteur qui contrôle l'aléatoire de la sortieSélectionnez le mot suivant dans une liste des k mots suivants les plus probables. Si Top-K est défini sur 10, il ne choisira que parmi les 10 possibilités les plus probables.
typical_pUn facteur qui contrôle l'aléatoire de la sortieLorsque le paramètre "typical_p" est défini sur une valeur inférieure à 1, l'algorithme sélectionne des jetons qui apparaissent plus souvent que des jetons aléatoires en fonction du contenu de texte précédent. Cela peut être utilisé pour filtrer certains jetons moins courants ou non pertinents et ne sélectionner que ceux qui sont plus significatifs ou pertinents. Lorsque le paramètre "typical_p" est défini sur 1, tous les jetons sont sélectionnés indépendamment de leur probabilité relative par rapport aux jetons aléatoires.
repetition_penaltyUn paramètre qui contrôle la répétition de la sortie1 signifie aucune pénalité
Des valeurs plus élevées = moins de répétition
Des valeurs plus basses = plus de répétition
encoder_repetition_penaltyUn paramètre qui affecte la cohérence entre le texte généré et le texte précédent1,0 signifie aucune pénalité
Plus la valeur est élevée, plus il est probable de rester dans le contexte lié au texte précédent ;
Plus la valeur est faible, plus il est probable de s'écarter du contexte lié au texte précédent.
no_repeat_ngram_sizeUn paramètre qui contrôle si les fragments répétés sont autorisés dans le texte généréDes valeurs plus élevées empêcheront les phrases plus longues d'apparaître plusieurs fois dans le texte généré, rendant le texte généré plus diversifié.
Des valeurs plus basses empêcheront la répétition de mots ou de lettres, rendant le texte généré plus unique.
min_lengthLa longueur minimale du texte généré