Skip to Main Content

Dcard 감정 게시글

시대가 어떻게 변하든, 가십과 감정적인 주제는 사람들의 삶에서 빠질 수 없는 역할을 항상 할 것입니다.

Dcard는 대만에서 인기있는 커뮤니티로, 섹션과 게시글로 구성됩니다. Dcard는 "감정", "뷰티", "기분" 등과 같은 다양한 섹션으로 나뉘며, 각 섹션에는 다양한 게시글이 있으며 사용자는 그에 대해 답글을 달 수 있습니다.

우리는 Dcard 포럼에서 일부 데이터를 수집하고 LLama 모델에서 세부 조정하여 Dcard 게시글을 생성할 수 있는 샘플 애플리케이션을 구축했습니다. (온라인 경험은 한 번에 하나의 사용자만 지원합니다. 사용이 불가능한 경우, 간소화된 버전을 사용하십시오.)

온라인 경험

간소화된 온라인 경험

첫 번째 Dcard 감정 게시글 생성하기

온라인 경험 페이지를 열고 "여자친구가 화났다"와 같은 이야기의 시작부분을 입력한 후, Generate를 클릭하면 모델이 자동으로 이야기를 완성합니다. 이야기의 플롯에 만족하지 못하면 생성을 언제든지 중지하고 직접 이야기를 수정한 후 생성을 계속할 수 있습니다.

Untitled

"정전, 남자친구", "어제", "최근 학교에서 소문이 있다" 등의 이야기 시작부를 스스로 고민하면 모델이 이야기를 보충해줍니다.

텍스트 생성 과정

이 애플리케이션을 예로 들어 텍스트 생성 과정을 간략히 체험해보겠습니다.

텍스트 생성의 논리는 상대적으로 간단합니다. "남자친구", "여자친구", "최근", "..."과 같은 이야기의 시작부를 입력한 후, 아래에 있는 Generate 버튼을 클릭하여 생성을 시작합니다. 생성을 중지해야 하는 경우 Stop 버튼을 클릭하고, 오른쪽의 max_new_tokens를 통해 생성할 수 있는 최대 길이를 제어할 수 있습니다.

Untitled

매개변수 조정

생성 결과를 다르게 만들기 위해 매개변수를 조정할 수 있습니다.

매개변수 탭으로 전환합니다.

Untitled

이러한 매개변수를 조정하여 생성된 텍스트의 다양성을 제어할 수 있습니다.

매개변수의 구체적인 의미는 아래 표에서 설명합니다.

매개변수기능설명
seed무작위 시드
temperature출력의 무작위성을 제어하는 주요 요소0 = 결정론적 (가장 가능성이 높은 토큰만 사용)
더 높은 값 = 더 많은 무작위성
Top-P출력의 무작위성을 제어하는 요소1보다 작은 float로 설정하면, 가장 가능성이 높은 토큰의 Top-K 또는 더 높은 합계 확률 집합만 생성에 유지
더 높은 값 = 더 다양한 가능한 무작위 결과
Top-K출력의 무작위성을 제어하는 요소다음 단어를 가장 가능성이 높은 다음 단어 목록에서 선택합니다. Top-K가 10으로 설정된 경우, 가장 가능성이 높은 10개의 가능성 중에서만 선택합니다.
typical_p출력의 무작위성을 제어하는 요소"typical_p" 매개변수가 1보다 작은 값으로 설정되면, 알고리즘은 이전 텍스트 콘텐츠를 기반으로 무작위 토큰보다 더 자주 나타나는 토큰을 선택합니다. 이는 일부 덜 일반적이거나 관련성이 적은 토큰을 필터링하고 의미있거나 관련성이 높은 토큰만 선택하는 데 사용할 수 있습니다. "typical_p" 매개변수가 1로 설정된 경우, 모든 토큰이 무작위 토큰과 상대적인 확률에 관계없이 선택됩니다.
repetition_penalty출력의 반복을 제어하는 매개변수1은 벌칙이 없음
더 높은 값 = 덜 반복
더 낮은 값 = 더 반복
encoder_repetition_penalty생성된 텍스트와 이전 텍스트 간의 일관성에 영향을 미치는 매개변수1.0은 벌칙이 없음
값이 높을수록 이전 텍스트와 관련된 문맥에 머무르는 것이 더 가능하며,
값이 낮을수록 이전 텍스트와 관련이 없는 문맥으로 벗어나는 것이 더 가능합니다.
no_repeat_ngram_size생성된 텍스트에서 반복되는 단편이 허용되는지 제어하는 매개변수더 높은 값은 생성된 텍스트에서 더 긴 구문이 반복되는 것을 방지하여 생성된 텍스트를 더 다양하게 만듭니다.
더 낮은 값은 단어 또는 문자 반복을 방지하여 생성된 텍스트를 더 유일하게 만듭니다.
min_length생성된 텍스트의 최소 길이