Reddit Crushes Post Fine-tune
Онлайн-опыт
Результаты
Описание данных
Обучающие данные взяты из сабреддита Reddit Crushes
Были собраны все посты по теме Crushes.
Краткое введение
Соберите данные о постах из Reddit Crush, преобразуйте их в обычные текстовые данные и проведите тонкую настройку обучения на модели TheBloke/Wizard-Vicuna-7B-Uncensored-HF.
Учебник
Обучение модели тонкой настройки
Установите text-generation-webui
Следуйте инструкциям по установке text-generation-webui.
Запустите text-generation-webui, выберите Model в верхней вкладке
Во вкладке Model введите TheBloke/Wizard-Vicuna-7B-Uncensored-HF, затем нажмите Download, чтобы загрузить базовую модель (вы также можете вручную загрузить модель и поместить ее в каталог models установочного каталога text-generation-webui).
Загрузите подготовленный набор данных reddit crush и поместите его в каталог training/datasets установочного каталога text-generation-webui.
Перейдите на вкладку training text-generation-webui
Выберите набор данных reddit crush
Переключитесь на Raw text file и выберите набор данных reddit crush
Начните обучение
Используйте параметры по умолчанию для обучения. Если вы хотите увеличить длину контекста, вы можете увеличить параметр cutoff.
Нажмите Start LoRA Training, чтобы начать обучение.
После начала обучения вы можете увидеть прогресс обучения в text-generation-webui.
Дождитесь завершения обучения модели. Обычно это занимает от 1 до 8 часов.
Результатом процесса обучения является сохранение в каталоге lora. Вы также можете прервать обучение на полпути и использовать существующую модель контрольной точки в каталоге lora.
Использование модели
Вручную создайте папку с названием reddit_crush в каталоге lora.
Скопируйте последнюю контрольную точку модели из папки в каталог lora.
Использование модели тонкой настройки
Перейдите на вкладку Model, сначала выберите Model
Выберите LoRA. Если выбор Lora не появляется, пожалуйста, нажмите кнопку обновления справа или проверьте, была ли модель LoRA помещена в каталог LoRA text-generation-webui.
Примените LoRA, нажмите Apply the selected LoRAs
После успешного применения вы увидите сообщение
Использование модели
Перейдите на вкладку Text generation, затем выведите начало истории, нажмите Generate, и продолжение истории будет автоматически сгенерировано справа.