Пост Dcard Emotion
Независимо от того, как меняются времена, сплетни и эмоциональные темы всегда будут играть незаменимую роль в жизни людей.
Dcard - популярное сообщество в Тайване, состоящее из разделов и постов. Dcard разделен на различные секции, такие как "эмоции", "красота", "настроение" и т. Д. В каждом разделе есть множество постов, и пользователи могут на них отвечать.
Мы собрали некоторые данные из форума Dcard и настроили их на модели LLama, чтобы создать пример приложения, которое может генерировать посты Dcard. (Онлайн-опыт поддерживает только одного пользователя за раз. Если он недоступен, используйте упрощенную версию для опыта.)
Сгенерируйте свой первый эмоциональный пост Dcard
Пожалуйста, откройте страницу онлайн-опыта и введите начало истории, например, "девушка зла".
Затем нажмите Generate, и модель автоматически завершит историю. Если вы не удовлетворены сюжетом истории, вы можете остановить генерацию в любое время, изменить историю самостоятельно и затем продолжить генерацию.
Вы можете придумать некоторые начала историй сами, такие как "отключение питания, парень", "вчера", "в последнее время в школе ходят слухи" и т. Д., И модель дополнит историю за вас.
Процесс генерации текста
Возьмем это приложение в качестве примера и кратко рассмотрим процесс генерации текста.
Логика генерации текста относительно проста. Введите начало истории, такое как "парень", "девушка", "в последнее время", "...", а затем нажмите кнопку Generate ниже, чтобы начать генерацию. Если вам нужно остановить генерацию, нажмите кнопку Stop и управляйте максимальной длиной генерируемого текста через max_new_tokens справа.
Настройка параметров
Вы можете настроить параметры, чтобы сделать сгенерированные результаты разными.
Перейдите на вкладку Parameters.
Изменяя эти параметры, вы можете контролировать разнообразие сгенерированных текстов.
Конкретные значения параметров показаны в таблице ниже.
Параметр | Функция | Объяснение |
---|---|---|
seed | Случайное зерно | |
температура | Основной фактор, который контролирует случайность вывода | 0 = детерминизм (используйте только наиболее вероятный токен) Более высокие значения = более случайность |
Top-P | Фактор, который контролирует случайность вывода | Если установлено на float <1, сохраняется только минимальный набор вероятностей, которые добавляются до Top-K или выше наиболее вероятных токенов для генерации Более высокие значения = более широкий диапазон возможных случайных результатов |
Top-K | Фактор, который контролирует случайность вывода | Выберите следующее слово из списка из верхних k наиболее вероятных следующих слов. Если Top-K установлен на 10, он выберет только из 10 наиболее вероятных возможностей. |
typical_p | Фактор, который контролирует случайность вывода | Когда параметр "typical_p" установлен на значение меньше 1, алгоритм выбирает токены, которые появляются чаще, чем случайные токены, на основе предыдущего текстового контента. Это может использоваться для фильтрации некоторых менее распространенных или несущественных токенов и выбора только тех, которые более значимы или релевантны. Когда параметр "typical_p" установлен на 1, выбираются все токены, независимо от их относительной вероятности к случайным токенам. |
repetition_penalty | Параметр, который контролирует повторение вывода | 1 означает отсутствие штрафа Более высокие значения = меньше повторений Более низкие значения = больше повторений |
encoder_repetition_penalty | Параметр, который влияет на связность между сгенерированным текстом и предыдущим текстом | 1,0 означает отсутствие штрафа Чем выше значение, тем больше вероятность оставаться в контексте, связанном с предыдущим текстом; Чем ниже значение, тем больше вероятность отклонения от контекста, связанного с предыдущим текстом. |
no_repeat_ngram_size | Параметр, который контролирует, разрешены ли повторяющиеся фрагменты в сгенерированном тексте | Более высокие значения предотвратят появление повторяющихся фраз в сгенерированном тексте, сделав его более разнообразным. Более низкие значения предотвратят повторение слов или букв, сделав сгенерированный текст более уникальным. |
min_length | Минимальная длина сгенерированного текста |