Skip to Main Content

Reddit Crush Post

Online-Erlebnis

Vereinfachtes Online-Erlebnis

Reddit ist die beliebteste Community im Internet, organisiert in kleinere Themen-Gruppen namens Subreddits, in denen Benutzer auf verschiedene Posts antworten können.

Wir haben Daten von einigen Reddit Crush-Themen gesammelt und sie auf dem LLama-Modell feinabgestimmt, um eine Beispielanwendung zur Generierung von Reddit-Posts zu erstellen. (Das Online-Erlebnis unterstützt nur einen Benutzer gleichzeitig. Wenn Sie es nicht nutzen können, versuchen Sie bitte die vereinfachte Version.)

Generieren Sie Ihren ersten Reddit Crush Post

Bitte öffnen Sie die Online-Erlebnisseite, geben Sie den Anfang Ihrer Geschichte ein, wie zum Beispiel "Ich treffe."

Untitled

Klicken Sie dann auf Generieren, und das Modell vervollständigt automatisch den Rest der Geschichte. Wenn Sie mit dem Plot nicht zufrieden sind, können Sie jederzeit die Generierung stoppen, die Geschichte selbst ändern und die Generierung fortsetzen.

Untitled

Sie können sich beliebige Geschichtsbeginne ausdenken, wie zum Beispiel "gestern" oder "vor kurzem", und das Modell vervollständigt die Geschichte für Sie.

Textgenerierungsprozess

Anhand dieser Anwendung wollen wir den Prozess der Textgenerierung erleben.

Die Logik der Textgenerierung ist relativ einfach: Geben Sie den Anfang Ihrer Geschichte ein, und das Modell wird sie weiter schreiben. Sie können die Generierung jederzeit pausieren, die Geschichte ändern und dann die Generierung fortsetzen.

Textgenerierung

Zunächst benötigen wir beim Generieren von Text eine Eröffnung als Eingabe, wie zum Beispiel "gestern", "Dieses süße Küken", "..." und so weiter. Klicken Sie dann auf die Schaltfläche Generieren unten, um mit der Generierung zu beginnen. Wenn Sie die Generierung stoppen müssen, klicken Sie auf die Schaltfläche Stop. Verwenden Sie das Feld max_new_tokens ganz rechts, um die maximale Länge des generierten Textes zu kontrollieren.

Untitled

Parameteranpassung

Sie können die Parameter anpassen, um unterschiedliche Ergebnisse zu erzielen.

Wechseln Sie zur Registerkarte Parameter.

Untitled

Durch Anpassung dieser Parameter können Sie die Diversität des generierten Textes kontrollieren.

Die spezifischen Bedeutungen der Parameter sind in der folgenden Tabelle aufgeführt.

ParameterFunktionErklärung
seedZufallszahlensamen
temperatureHauptfaktor zur Kontrolle der Ausgabezufälligkeit0 = Determinismus (nur das wahrscheinlichste Token verwenden)
Höhere Werte = mehr Zufälligkeit
Top-PFaktor zur Kontrolle der AusgabezufälligkeitWenn auf float<1 eingestellt, werden nur die minimale Menge an Wahrscheinlichkeiten beibehalten, die Top-K oder höher der wahrscheinlichsten Tokens ergeben.
Höhere Werte = eine breitere Palette möglicher zufälliger Ergebnisse.
Top-KFaktor zur Kontrolle der AusgabezufälligkeitWählen Sie das nächste Wort aus einer Liste der k wahrscheinlichsten nächsten Wörter aus. Wenn Top-K auf 10 gesetzt ist, wird nur aus den 10 wahrscheinlichsten Möglichkeiten ausgewählt.
typical_pFaktor zur Kontrolle der AusgabezufälligkeitWenn der Parameter "typical_p" auf einen Wert kleiner als 1 gesetzt ist, wählt der Algorithmus Tokens aus, die häufiger als zufällige Tokens aufgrund des vorherigen Textinhalts erscheinen. Dies kann verwendet werden, um einige weniger häufige oder irrelevante Tokens auszufiltern und nur solche auszuwählen, die sinnvoller oder relevanter sind. Wenn der Parameter "typical_p" auf 1 gesetzt ist, werden alle Tokens unabhängig von ihrer relativen Wahrscheinlichkeit mit zufälligen Tokens ausgewählt.
repetition_penaltyParameter zur Kontrolle der Ausgabenwiederholung1 bedeutet keine Strafe
Höhere Werte = weniger Wiederholung
Niedrigere Werte = mehr Wiederholung
encoder_repetition_penaltyBeeinflusst die Kohärenz zwischen dem generierten Text und dem vorherigen Text1,0 bedeutet keine Strafe
Höhere Werte zeigen eine größere Tendenz, im Zusammenhang mit dem vorherigen Text zu bleiben;
Niedrigere Werte machen es einfacher, vom Zusammenhang mit dem vorherigen Text abzuweichen.
no_repeat_ngram_sizeKontrolliert, ob wiederholte Fragmente im generierten Text erlaubt sindHöhere Werte verhindern, dass längere Phrasen im generierten Text wiederholt auftreten, was den generierten Text vielfältiger macht.
Niedrigere Werte verhindern die Wiederholung von Wörtern oder Buchstaben und machen den generierten Text einzigartiger.
min_lengthMinimale Länge des generierten Textes