Skip to Main Content

Пост Dcard Emotion

Независимо от того, как меняются времена, сплетни и эмоциональные темы всегда будут играть незаменимую роль в жизни людей.

Dcard - популярное сообщество в Тайване, состоящее из разделов и постов. Dcard разделен на различные секции, такие как "эмоции", "красота", "настроение" и т. Д. В каждом разделе есть множество постов, и пользователи могут на них отвечать.

Мы собрали некоторые данные из форума Dcard и настроили их на модели LLama, чтобы создать пример приложения, которое может генерировать посты Dcard. (Онлайн-опыт поддерживает только одного пользователя за раз. Если он недоступен, используйте упрощенную версию для опыта.)

Онлайн-опыт

Упрощенный онлайн-опыт

Сгенерируйте свой первый эмоциональный пост Dcard

Пожалуйста, откройте страницу онлайн-опыта и введите начало истории, например, "девушка зла".

Untitled

Затем нажмите Generate, и модель автоматически завершит историю. Если вы не удовлетворены сюжетом истории, вы можете остановить генерацию в любое время, изменить историю самостоятельно и затем продолжить генерацию.

Untitled

Вы можете придумать некоторые начала историй сами, такие как "отключение питания, парень", "вчера", "в последнее время в школе ходят слухи" и т. Д., И модель дополнит историю за вас.

Процесс генерации текста

Возьмем это приложение в качестве примера и кратко рассмотрим процесс генерации текста.

Логика генерации текста относительно проста. Введите начало истории, такое как "парень", "девушка", "в последнее время", "...", а затем нажмите кнопку Generate ниже, чтобы начать генерацию. Если вам нужно остановить генерацию, нажмите кнопку Stop и управляйте максимальной длиной генерируемого текста через max_new_tokens справа.

Untitled

Настройка параметров

Вы можете настроить параметры, чтобы сделать сгенерированные результаты разными.

Перейдите на вкладку Parameters.

Untitled

Изменяя эти параметры, вы можете контролировать разнообразие сгенерированных текстов.

Конкретные значения параметров показаны в таблице ниже.

ПараметрФункцияОбъяснение
seedСлучайное зерно
температураОсновной фактор, который контролирует случайность вывода0 = детерминизм (используйте только наиболее вероятный токен)
Более высокие значения = более случайность
Top-PФактор, который контролирует случайность выводаЕсли установлено на float <1, сохраняется только минимальный набор вероятностей, которые добавляются до Top-K или выше наиболее вероятных токенов для генерации
Более высокие значения = более широкий диапазон возможных случайных результатов
Top-KФактор, который контролирует случайность выводаВыберите следующее слово из списка из верхних k наиболее вероятных следующих слов. Если Top-K установлен на 10, он выберет только из 10 наиболее вероятных возможностей.
typical_pФактор, который контролирует случайность выводаКогда параметр "typical_p" установлен на значение меньше 1, алгоритм выбирает токены, которые появляются чаще, чем случайные токены, на основе предыдущего текстового контента. Это может использоваться для фильтрации некоторых менее распространенных или несущественных токенов и выбора только тех, которые более значимы или релевантны. Когда параметр "typical_p" установлен на 1, выбираются все токены, независимо от их относительной вероятности к случайным токенам.
repetition_penaltyПараметр, который контролирует повторение вывода1 означает отсутствие штрафа
Более высокие значения = меньше повторений
Более низкие значения = больше повторений
encoder_repetition_penaltyПараметр, который влияет на связность между сгенерированным текстом и предыдущим текстом1,0 означает отсутствие штрафа
Чем выше значение, тем больше вероятность оставаться в контексте, связанном с предыдущим текстом;
Чем ниже значение, тем больше вероятность отклонения от контекста, связанного с предыдущим текстом.
no_repeat_ngram_sizeПараметр, который контролирует, разрешены ли повторяющиеся фрагменты в сгенерированном текстеБолее высокие значения предотвратят появление повторяющихся фраз в сгенерированном тексте, сделав его более разнообразным.
Более низкие значения предотвратят повторение слов или букв, сделав сгенерированный текст более уникальным.
min_lengthМинимальная длина сгенерированного текста