Post Crush Reddit
Reddit est la communauté la plus populaire sur Internet, organisée en petits groupes de sujets appelés sous-reddits, chacun avec différents messages où les utilisateurs peuvent répondre.
Nous avons collecté des données de certains sujets de Reddit Crush et les avons affinées sur le modèle LLama, créant une application d'exemple pour générer des messages Reddit. (L'expérience en ligne ne prend en charge qu'un utilisateur à la fois. Si vous ne pouvez pas l'utiliser, veuillez essayer la version simplifiée.)
Générer votre premier message Reddit Crush
Veuillez ouvrir la page expérience en ligne, entrez le début de votre histoire, tel que "Je rencontre."
Ensuite, cliquez sur Générer, et le modèle complétera automatiquement le reste de l'histoire. Si vous n'êtes pas satisfait de l'intrigue, vous pouvez arrêter la génération à tout moment, modifier l'histoire vous-même et continuer à générer.
Vous pouvez inventer n'importe quel début d'histoire que vous aimez, comme "hier" ou "récemment", et le modèle complétera l'histoire pour vous.
Processus de génération de texte
En utilisant cette application comme exemple, expérimentons le processus de génération de texte.
La logique de la génération de texte est relativement simple: entrez le début de votre histoire et le modèle continuera de l'écrire. Vous pouvez mettre en pause la génération à tout moment, modifier l'histoire, puis continuer à générer.
Génération de texte
Tout d'abord, lors de la génération de texte, nous avons besoin de donner une ouverture en entrée, telle que "hier", "Cette jolie poulette", "...", etc. Ensuite, cliquez sur le bouton Générer ci-dessous pour commencer la génération. Si vous avez besoin d'arrêter la génération, cliquez sur le bouton Arrêter. Utilisez max_new_tokens à droite pour contrôler la longueur maximale du texte généré.
Ajustement des paramètres
Vous pouvez ajuster les paramètres pour produire des résultats différents.
Passez à l'onglet Paramètres.
En ajustant ces paramètres, vous pouvez contrôler la diversité du texte généré.
Les significations spécifiques des paramètres sont indiquées dans le tableau ci-dessous.
Paramètre | Fonction | Explication |
---|---|---|
seed | Graine aléatoire | |
temperature | Facteur principal contrôlant l'aléatoire de sortie | 0 = déterminisme (utilise uniquement le jeton le plus probable) Des valeurs plus élevées = plus d'aléatoire |
Top-P | Facteur contrôlant l'aléatoire de sortie | Si défini sur float<1, seuls l'ensemble minimal de probabilités qui s'ajoutent à Top-K ou plus des jetons les plus probables sont conservés pour la génération. Des valeurs plus élevées = une plus large gamme de résultats aléatoires possibles. |
Top-K | Facteur contrôlant l'aléatoire de sortie | Choisissez le mot suivant dans une liste des k mots suivants les plus probables. Si Top-K est défini sur 10, il ne choisira que parmi les 10 possibilités les plus probables. |
typical_p | Facteur contrôlant l'aléatoire de sortie | Lorsque le paramètre "typical_p" est défini sur une valeur inférieure à 1, l'algorithme sélectionne des jetons qui apparaissent plus souvent que des jetons aléatoires en fonction du contenu de texte précédent. Cela peut être utilisé pour filtrer certains jetons moins courants ou non pertinents et ne sélectionner que ceux qui sont plus significatifs ou pertinents. Lorsque le paramètre "typical_p" est défini sur 1, tous les jetons sont sélectionnés indépendamment de leur probabilité relative avec des jetons aléatoires. |
repetition_penalty | Paramètre contrôlant la répétition de sortie | 1 signifie aucune pénalité Des valeurs plus élevées = moins de répétition Des valeurs plus basses = plus de répétition |
encoder_repetition_penalty | Affecte la cohérence entre le texte généré et le texte précédent | 1,0 signifie aucune pénalité Des valeurs plus élevées indiquent une plus grande tendance à rester dans le contexte lié au texte précédent; Des valeurs plus basses facilitent la déviation du contexte lié au texte précédent. |
no_repeat_ngram_size | Contrôle si les fragments répétés sont autorisés dans le texte généré | Des valeurs plus élevées empêchent les phrases plus longues d'apparaître plusieurs fois dans le texte généré, rendant le texte généré plus diversifié. Des valeurs plus basses empêchent la répétition de mots ou de lettres, rendant le texte généré plus unique. |
min_length | Longueur minimale du texte généré |