Skip to Main Content

Reddit Crushes Post Fine-tune

Онлайн-опыт

Reddit Crush Online

Результаты

Untitled

Untitled2

Untitled3

Описание данных

Обучающие данные взяты из сабреддита Reddit Crushes

Были собраны все посты по теме Crushes.

Краткое введение

Соберите данные о постах из Reddit Crush, преобразуйте их в обычные текстовые данные и проведите тонкую настройку обучения на модели TheBloke/Wizard-Vicuna-7B-Uncensored-HF.

Учебник

Обучение модели тонкой настройки

  1. Установите text-generation-webui

    Следуйте инструкциям по установке text-generation-webui.

  2. Запустите text-generation-webui, выберите Model в верхней вкладке Untitled

  3. Во вкладке Model введите TheBloke/Wizard-Vicuna-7B-Uncensored-HF, затем нажмите Download, чтобы загрузить базовую модель (вы также можете вручную загрузить модель и поместить ее в каталог models установочного каталога text-generation-webui). Untitled

  4. Загрузите подготовленный набор данных reddit crush и поместите его в каталог training/datasets установочного каталога text-generation-webui.

    Untitled

  5. Перейдите на вкладку training text-generation-webui

    Untitled

  6. Выберите набор данных reddit crush

    Переключитесь на Raw text file и выберите набор данных reddit crush

    Untitled

  7. Начните обучение

    Используйте параметры по умолчанию для обучения. Если вы хотите увеличить длину контекста, вы можете увеличить параметр cutoff.

    Нажмите Start LoRA Training, чтобы начать обучение.

    После начала обучения вы можете увидеть прогресс обучения в text-generation-webui.

    Untitled

    Дождитесь завершения обучения модели. Обычно это занимает от 1 до 8 часов.

    Результатом процесса обучения является сохранение в каталоге lora. Вы также можете прервать обучение на полпути и использовать существующую модель контрольной точки в каталоге lora.

    Untitled

  8. Использование модели

    Вручную создайте папку с названием reddit_crush в каталоге lora.

    Скопируйте последнюю контрольную точку модели из папки в каталог lora.

    Untitled

Использование модели тонкой настройки

  1. Перейдите на вкладку Model, сначала выберите Model Untitled

  2. Выберите LoRA. Если выбор Lora не появляется, пожалуйста, нажмите кнопку обновления справа или проверьте, была ли модель LoRA помещена в каталог LoRA text-generation-webui.

    Untitled

  3. Примените LoRA, нажмите Apply the selected LoRAs Untitled

  4. После успешного применения вы увидите сообщение Untitled

  5. Использование модели

    Перейдите на вкладку Text generation, затем выведите начало истории, нажмите Generate, и продолжение истории будет автоматически сгенерировано справа. Untitled