Skip to Main Content

Текстовые модели AIGC

В настоящее время существует множество текстовых моделей, некоторые из которых являются продуктами настройки существующих больших моделей, а некоторые - базовыми моделями, обученными с нуля различными компаниями.

Известные базовые модели

Базовая модельДата выпускаРазмер моделиИздательЯзыкОсобенности
LLaMA2023.037B~65BMetaГлавным образом английский, слабая поддержка для других языков
MPT2023.057BmosaicmlГлавным образом английский, слабая поддержка для других языковКоммерчески доступна, поддерживает длинные контексты
ChatGLM2023.036BTHUDMКитайский и английский
Cerebras-GPT2023.031.3B~13BcerebrasГлавным образом английский, слабая поддержка для других языков
rwkv-4-raven2023.041.5B~14BBlinkDLРазные версии, разные версии имеют разную поддержку языковНе трансформирует структуру
OpenFlamingo2023.039BLAIONГлавным образом английский, слабая поддержка для других языковМульти-модальная, поддерживает изображения
StableLM2023.043B~7Bstability.aiГлавным образом английский, слабая поддержка для других языков
Bloom2022.101B~176Bbigscience59 языков
RedPajama-INCITE2023.053B~7BtogetherГлавным образом английский, слабая поддержка для других языков
pythia2023.031B~12Beleuther.aiАнглийский
GPT-Neo2021.03125M~2.7Beleuther.aiАнглийский
GPT-J2021.036Beleuther.aiАнглийский
GPT-NeoX2022.0220Beleuther.aiАнглийский
OPT2022.05125M-175BMetaГлавным образом английский, слабая поддержка для других языков

Замечания

Связь между другими известными моделями в сообществе и этими базовыми моделями показана в следующей таблице.

Базовая модельНазвание моделиМетод настройкиИздательВведение
LLaMAAlpacaПолная настройка параметровstanfordНастроенная модель LLaMA, настроенная с использованием OpenAI's text-davinci-003
Alpaca-LoRAЛегкая настройкаtloenТо же, что и Alpaca, но настроенная с использованием Lora
VicunaПолная настройка параметровLMSYS OrgНастроенная модель LLaMA, обученная и настроенная с использованием диалогов, собранных от пользователей, собранных из ShareGPT
KoalaПолная настройка параметровberkeleyНастроенная модель LLaMA
WizardLMПолная настройка параметровWizardLMНастроенная модель LLaMA, сосредоточенная на настройке сложных инструкций
GPT-Jdolly-v1Полная настройка параметровdatabricksНастроенная модель GPT-J, сосредоточенная на настройке инструкций
gpt4all-jПолная настройка параметровnomic.aiНастроенная модель GPT-J
pythiadolly-v2Полная настройка параметровdatabricksНастроенная модель pythia, сосредоточенная на настройке инструкций