Skip to Main Content

모델 파인튜닝 소개

"모델 파인튜닝은 연금술의 궁극적인 비밀입니다." 전설적인 연금술사 이다르 알케미는 "연금술서"에서 이렇게 말합니다.

모델 파인튜닝 소개

모델 파인튜닝이란 무엇인가요?

먼저 몇 가지 현실적인 시나리오를 생각해 봅시다.

  1. 특정한 연예인을 좋아하고 모델이 이 연예인의 사진을 생성하도록 하려면 모델에게 어떻게 이 특정 연예인의 사진을 생성하도록 지시할 수 있을까요?
  2. 역할극 게임에서 고양이 소녀 역할을 하는 챗봇과 함께 하고 싶다고 가정해 봅시다. 대화 도중 이 고양이 소녀에게 감정이 생기지만 새로운 대화 문맥에서 다시 이 고양이 소녀 역할을 하는 경우, 챗봇의 말투와 성격이 이전과 눈에 띄게 다릅니다. 챗봇의 말투/성격을 일관되게 유지하는 방법은 무엇일까요?
  3. 친구 X가 사망하고, 챗봇을 이용해 X처럼 꾸며진 가상 인물과 대화하고 싶다고 가정해 봅시다. 가능한 한 X와 유사한 챗봇을 만들기 위해 복잡한 배경 설정을 챗봇에 제공합니다. 그러나 배경 설정이 너무 길어 대화 문맥이 길어지면 챗봇은 이전 대화 내용을 자주 잊게 됩니다. 이 문제를 해결하는 방법은 무엇일까요?

이러한 세 가지 시나리오에서는 모델의 입력(프롬프트)을 수정하는 것만으로는 문제를 해결할 수 없습니다. 이 문제들은 다음과 같습니다.

  1. 자연어로 원하는 생성 콘텐츠를 정확하게 설명하는 것이 불가능할 수 있습니다.

    예를 들어, 얼굴에 대해서는 우리가 연예인이 큰 눈, 높은 코 다리미, 검은 머리 등을 가졌다고 모델에게 말해도, 모델은 여전히 우리가 생성하려는 사람의 종류를 정확하게 판단할 수 없습니다. 우리는 언어로 사람의 얼굴을 정확하게 설명할 수 없습니다.

  2. 간단한 자연어 설명으로는 모델이 생성하는 콘텐츠가 안정적이지 않을 수 있습니다.

    예를 들어, 역할극 시나리오에서 우리는 챗봇에게 특정한 캐릭터를 연기하도록 지시합니다. 심지어 텍스트를 통해 캐릭터의 말투나 성격을 설명해도, 챗봇의 대답은 여러 플레이와 대화에서 우리의 설정과 다를 수 있습니다.

    모델의 생성에 대한 간단한 텍스트 제약 조건은 일반적으로 정확도가 낮습니다. 우리는 간단한 텍스트로 사람을 정확하게 설명할 수 없습니다.

  3. 모델의 간단한 텍스트 제약 조건은 제한적인 텍스트의 길이로 인해 대화가 너무 짧아질 수 있습니다.

    자연어 제약 조건을 통해 정확성을 향상시키기 위해서는 더 긴 자연어 제약 조건이 필요합니다. 자연어 제약 조건이 길수록 대화 문맥 공간을 차지하므로 실제 대화가 너무 짧아질 수 있습니다.

이러한 문제를 간단한 입력 조정으로 해결할 수 없을 때, 모델 파인튜닝 기술이 필요합니다.

모델 파인튜닝은 특정 데이터에 대해 기존 모델을 재학습하여 모델을 특정 시나리오에 더 적합하게 만드는 것을 의미합니다.

예를 들어, 위의 시나리오에서 마주치는 문제들은 모두 모델 파인튜닝을 통해 해결할 수 있습니다.

  1. 자연어로 원하는 생성 콘텐츠를 정확하게 설명하는 것이 불가능할 수 있습니다.

    언어로 연예인의 얼굴을 설명할 수 없으므로, 그들의 사진을 사용하여 모델에게 생성하고자 하는 사람의 종류를 알려줄 수 있습니다.

    먼저, 온라인에서 해당 연예인의 10-40개의 명확한 얼굴 사진을 수집한 다음 이 사진들로 모델을 파인튜닝합니다. 파인튜닝 후, 우리는 이 연예인의 사진을 생성하기 위해 파인튜닝된 모델을 사용할 수 있습니다.

  2. 간단한 자연어 설명으로는 모델이 생성하는 콘텐츠가 안정적이지 않을 수 있습니다.

    먼저, 우리는 이전에 좋아했던 고양이 소녀의 채팅 데이터를 수집하고 그녀의 말투를 찾아야 합니다. 이전 대화 데이터가 충분하지 않은 경우, 챗봇에게 이 스타일을 모방하는 여러 언어를 직접 생성하도록 하고 적합한 텍스트를 선택할 수 있습니다. 그런 다음 이 텍스트로 모델을 파인튜닝하면 파인튜닝된 모델은 파인튜닝 데이터의 스타일에 가까운 텍스트를 출력합니다.

  3. 모델의 간단한 텍스트 제약 조건은 제한적인 텍스트의 길이로 인해 대화가 너무 짧아질 수 있습니다.

    먼저, 우리는 친구 X의 채팅 대화 및 캐릭터 배경과 같은 일부 데이터를 준비해야 합니다. 그런 다음 이 텍스트로 모델을 파인튜닝하면 파인튜닝된 모델은 복잡한 배경 설정 없이도 이 캐릭터의 스타일로 직접 대화할 수 있습니다.

일반적으로 모델 파인튜닝의 중요성은 모델이 생성하는 콘텐츠를 더 맞춤화하는 것입니다.

언제 모델 파인튜닝이 필요하지 않은가요?

예를 들어, 이미지에서 등장하는 캐릭터가 모두 흰색 티셔츠를 입고 있다고 지정하거나, 챗봇이 실용적인 역할을 하는 경우와 같이 맞춤화되지 않은 시나리오에서는 일반 모델을 파인튜닝하지 않고 사용할 수 있습니다.

모델 파인튜닝을 위해 준비해야 할 것

장비: Nvidia 그래픽 카드가 장착된 컴퓨터(이러한 장비가 없는 경우 온라인 서비스를 대여할 수 있습니다.)

데이터:

  • 이미지 유형의 경우 일부 이미지를 준비해야 합니다.
  • 텍스트 유형의 경우 텍스트 말뭉치를 준비해야 합니다.
  • 오디오 유형의 경우 일부 음악 또는 노래 파일을 준비해야 합니다.

파인튜닝된 모델 사용 방법

모델 사용 개요의 내용을 참조하세요.