Skip to Main Content

Post Crush Reddit

Expérience en ligne

Expérience en ligne simplifiée

Reddit est la communauté la plus populaire sur Internet, organisée en petits groupes de sujets appelés sous-reddits, chacun avec différents messages où les utilisateurs peuvent répondre.

Nous avons collecté des données de certains sujets de Reddit Crush et les avons affinées sur le modèle LLama, créant une application d'exemple pour générer des messages Reddit. (L'expérience en ligne ne prend en charge qu'un utilisateur à la fois. Si vous ne pouvez pas l'utiliser, veuillez essayer la version simplifiée.)

Générer votre premier message Reddit Crush

Veuillez ouvrir la page expérience en ligne, entrez le début de votre histoire, tel que "Je rencontre."

Untitled

Ensuite, cliquez sur Générer, et le modèle complétera automatiquement le reste de l'histoire. Si vous n'êtes pas satisfait de l'intrigue, vous pouvez arrêter la génération à tout moment, modifier l'histoire vous-même et continuer à générer.

Untitled

Vous pouvez inventer n'importe quel début d'histoire que vous aimez, comme "hier" ou "récemment", et le modèle complétera l'histoire pour vous.

Processus de génération de texte

En utilisant cette application comme exemple, expérimentons le processus de génération de texte.

La logique de la génération de texte est relativement simple: entrez le début de votre histoire et le modèle continuera de l'écrire. Vous pouvez mettre en pause la génération à tout moment, modifier l'histoire, puis continuer à générer.

Génération de texte

Tout d'abord, lors de la génération de texte, nous avons besoin de donner une ouverture en entrée, telle que "hier", "Cette jolie poulette", "...", etc. Ensuite, cliquez sur le bouton Générer ci-dessous pour commencer la génération. Si vous avez besoin d'arrêter la génération, cliquez sur le bouton Arrêter. Utilisez max_new_tokens à droite pour contrôler la longueur maximale du texte généré.

Untitled

Ajustement des paramètres

Vous pouvez ajuster les paramètres pour produire des résultats différents.

Passez à l'onglet Paramètres.

Untitled

En ajustant ces paramètres, vous pouvez contrôler la diversité du texte généré.

Les significations spécifiques des paramètres sont indiquées dans le tableau ci-dessous.

ParamètreFonctionExplication
seedGraine aléatoire
temperatureFacteur principal contrôlant l'aléatoire de sortie0 = déterminisme (utilise uniquement le jeton le plus probable)
Des valeurs plus élevées = plus d'aléatoire
Top-PFacteur contrôlant l'aléatoire de sortieSi défini sur float<1, seuls l'ensemble minimal de probabilités qui s'ajoutent à Top-K ou plus des jetons les plus probables sont conservés pour la génération.
Des valeurs plus élevées = une plus large gamme de résultats aléatoires possibles.
Top-KFacteur contrôlant l'aléatoire de sortieChoisissez le mot suivant dans une liste des k mots suivants les plus probables. Si Top-K est défini sur 10, il ne choisira que parmi les 10 possibilités les plus probables.
typical_pFacteur contrôlant l'aléatoire de sortieLorsque le paramètre "typical_p" est défini sur une valeur inférieure à 1, l'algorithme sélectionne des jetons qui apparaissent plus souvent que des jetons aléatoires en fonction du contenu de texte précédent. Cela peut être utilisé pour filtrer certains jetons moins courants ou non pertinents et ne sélectionner que ceux qui sont plus significatifs ou pertinents. Lorsque le paramètre "typical_p" est défini sur 1, tous les jetons sont sélectionnés indépendamment de leur probabilité relative avec des jetons aléatoires.
repetition_penaltyParamètre contrôlant la répétition de sortie1 signifie aucune pénalité
Des valeurs plus élevées = moins de répétition
Des valeurs plus basses = plus de répétition
encoder_repetition_penaltyAffecte la cohérence entre le texte généré et le texte précédent1,0 signifie aucune pénalité
Des valeurs plus élevées indiquent une plus grande tendance à rester dans le contexte lié au texte précédent;
Des valeurs plus basses facilitent la déviation du contexte lié au texte précédent.
no_repeat_ngram_sizeContrôle si les fragments répétés sont autorisés dans le texte généréDes valeurs plus élevées empêchent les phrases plus longues d'apparaître plusieurs fois dans le texte généré, rendant le texte généré plus diversifié.
Des valeurs plus basses empêchent la répétition de mots ou de lettres, rendant le texte généré plus unique.
min_lengthLongueur minimale du texte généré