Skip to Main Content

Modèles de texte AIGC

Il existe actuellement de nombreux modèles de texte, certains étant le produit du réglage fin des modèles existants, et d'autres étant des modèles de base entraînés à partir de zéro par diverses entreprises.

Modèles de base bien connus

Modèle de baseDate de sortieTaille du modèleÉditeurLangueFonctionnalités
LLaMA2023.037B~65BMetaPrincipalement en anglais, support faible pour d'autres langues
MPT2023.057BmosaicmlPrincipalement en anglais, support faible pour d'autres languesDisponible commercialement, prend en charge les contextes longs
ChatGLM2023.036BTHUDMChinois et anglais
Cerebras-GPT2023.031,3B~13BcerebrasPrincipalement en anglais, support faible pour d'autres langues
rwkv-4-raven2023.041,5B~14BBlinkDLVersions multiples, différentes versions ont un support linguistique différentStructure non transformée
OpenFlamingo2023.039BLAIONPrincipalement en anglais, support faible pour d'autres languesMulti-modal, prend en charge les images
StableLM2023.043B~7Bstability.aiPrincipalement en anglais, support faible pour d'autres langues
Bloom2022.101B~176Bbigscience59 langues
RedPajama-INCITE2023.053B~7BtogetherPrincipalement en anglais, support faible pour d'autres langues
pythia2023.031B~12Beleuther.aiAnglais
GPT-Neo2021.03125M~2.7Beleuther.aiAnglais
GPT-J2021.036Beleuther.aiAnglais
GPT-NeoX2022.0220Beleuther.aiAnglais
OPT2022.05125M-175BMetaPrincipalement en anglais, support faible pour d'autres langues

Remarques

La relation entre d'autres modèles bien connus dans la communauté et ces modèles de base est présentée dans le tableau suivant.

Modèle de baseNom du modèleMéthode de réglage finÉditeurIntroduction
LLaMAAlpacaRéglage fin de tous les paramètresstanfordModèle affiné de LLaMA, affiné en utilisant le modèle text-davinci-003 d'OpenAI
Alpaca-LoRARéglage fin légertloenIdentique à Alpaca, mais affiné en utilisant Lora
VicunaRéglage fin de tous les paramètresLMSYS OrgModèle affiné de LLaMA, entraîné et affiné en utilisant des dialogues partagés par les utilisateurs collectés à partir de ShareGPT
KoalaRéglage fin de tous les paramètresberkeleyModèle affiné de LLaMA
WizardLMRéglage fin de tous les paramètresWizardLMModèle affiné de LLaMA, axé sur l'affinage des instructions complexes
GPT-Jdolly-v1Réglage fin de tous les paramètresdatabricksModèle affiné de GPT-J, axé sur l'affinage des instructions
gpt4all-jRéglage fin de tous les paramètresnomic.aiModèle affiné de GPT-J
pythiadolly-v2Réglage fin de tous les paramètresdatabricksModèle affiné de pythia, axé sur l'affinage des instructions