Skip to Main Content

Reddit Crushes Post Fine-tune

온라인 경험

Reddit Crush Online

결과

Untitled

Untitled2

Untitled3

데이터 설명

학습 데이터는 Reddit Crushes subreddit에서 수집되었습니다.

Crushes 주제 아래의 모든 게시물이 수집되었습니다.

간단한 소개

Reddit Crush에서 게시 데이터를 수집하여 일반 텍스트 데이터로 변환한 후, TheBloke/Wizard-Vicuna-7B-Uncensored-HF 모델에서 세밀 조정 학습을 수행합니다.

튜토리얼

세밀 조정 모델 훈련

  1. text-generation-webui 설치

    text-generation-webui의 설치 가이드를 따라 text-generation-webui를 설치합니다.

  2. text-generation-webui 시작, 상단 탭에서 Model을 선택합니다. Untitled

  3. Model 탭에서 TheBloke/Wizard-Vicuna-7B-Uncensored-HF를 입력한 후 Download를 클릭하여 기본 모델을 다운로드합니다(모델을 수동으로 다운로드하여 text-generation-webui 설치 디렉토리의 models 디렉토리에 넣을 수도 있습니다). Untitled

  4. 준비된 reddit crush dataset을 다운로드하고 text-generation-webui 설치 디렉토리의 training/datasets 디렉토리에 데이터셋을 배치합니다.

    Untitled

  5. text-generation-webui의 training 탭으로 전환합니다.

    Untitled

  6. reddit crush dataset을 선택합니다.

    Raw text file로 전환하여 reddit crush dataset을 선택합니다.

    Untitled

  7. 훈련 시작

    기본 매개변수를 사용하여 훈련합니다. 컨텍스트 길이를 늘리고 싶다면 cutoff 매개변수를 늘릴 수 있습니다.

    Start LoRA Training을 클릭하여 훈련을 시작합니다.

    훈련이 시작되면 text-generation-webui에서 훈련 진행 상황을 볼 수 있습니다.

    Untitled

    모델 훈련이 완료될 때까지 기다립니다. 보통 1-8시간이 소요됩니다.

    훈련 과정의 결과는 lora 디렉토리에 저장됩니다. 중간에 훈련을 중단하고 lora 디렉토리의 기존 체크포인트 모델을 사용할 수도 있습니다.

    Untitled

  8. 모델 사용

    lora 디렉토리에 reddit_crush라는 폴더를 수동으로 생성합니다.

    최신 체크포인트 모델을 폴더에서 lora 디렉토리로 복사합니다.

    Untitled

세밀 조정 모델 사용

  1. Model 탭으로 전환한 후, 먼저 Model을 선택합니다. Untitled

  2. LoRA를 선택합니다. LoRA 선택이 나타나지 않는 경우, 오른쪽의 새로고침 버튼을 클릭하거나 text-generation-webui의 LoRA 디렉토리에 LoRA 모델이 배치되어 있는지 확인합니다.

    Untitled

  3. LoRA를 적용하고 선택한 LoRA를 적용을 클릭합니다. Untitled

  4. 적용이 성공하면 메시지가 나타납니다. Untitled

  5. 모델 사용

    Text generation 탭으로 전환하여 이야기의 시작 부분을 출력하고 Generate를 클릭하면 이야기의 계속이 자동으로 생성됩니다.

    Untitled