Un concurrent open-source de ChatGPT vient d’être lancé par l’équipe de Stable Diffusion

20 avril 2023 Hibou Gourou

Le plus récent challenger du ChatGPT d'OpenAI vient de la société qui fabrique le populaire générateur d'images AI Stable Diffusion . Connu sous le nom de StableLM, Stability AI a développé ce chatbot open source pour démocratiser l'accès aux modèles de langage avancés.

Stability AI a récemment annoncé la version alpha de StableLM, notant qu'il s'agit d'une solution plus petite et plus efficace que la plupart des autres. StableLM utilise seulement trois à sept milliards de paramètres, soit 2 à 4 % de la taille du modèle de 175 milliards de paramètres de ChatGPT.

IA de stabilité

Tout comme Stable Diffusion est un générateur d'images plus accessible qui peut être étendu par des développeurs tiers, StableLM propose la même solution gratuite et open-source qu'un chatbot IA accessible à tous.

Grâce à la formation sur un nouvel ensemble de données expérimental d'EleutherAI appelé "The Pile", StableLM peut poursuivre des conversations et écrire du code avec des performances élevées. Stability AI note que cet ensemble de données contient 1,5 billion de jetons, soit trois fois plus que l'ensemble de données utilisé pour former la plupart des modèles d'IA. ChatGPT a été formé sur "The Pile" mais a subi plus de raffinements par la suite, y compris l'apprentissage par renforcement pour aider à réduire les résultats erronés. ChatGPT a considérablement progressé depuis sa sortie au public, et la plupart pensent qu'il est le leader du chat IA.

Un modèle d'IA très efficace est essentiel pour Stability AI car il veut faire fonctionner StableLM sur des systèmes à moindre coût et des GPU moins puissants. Vous pouvez installer et exécuter la version alpha de StableLM dès aujourd'hui. Les instructions se trouvent dans le référentiel GitHub , ainsi qu'un bloc-notes avec des détails sur son utilisation sur un ordinateur avec des capacités GPU limitées.

La façon la plus simple d'essayer StableLM est d'aller sur la page de démonstration de Hugging Face. Comme cela vient d'être lancé et qu'il y aura probablement une forte demande, les temps de réponse pourraient être lents et, en tant que version alpha, les résultats ne seront pas aussi bons que la version finale.

Par exemple, lorsque j'ai demandé à StableLM de m'aider à rédiger une lettre d'excuses pour avoir cassé le téléphone de quelqu'un, il m'a dit que j'avais fait ce que j'étais censé faire. L'IA a mal compris et a pensé que j'avais offert un cadeau plutôt que d'avoir endommagé un téléphone.

La version alpha de StableLM est parfois confuse,

Stability AI inclut une clause de non-responsabilité concernant les résultats, car StableLM est un modèle de langage étendu pré-entraîné sans ajustement supplémentaire. Il n'utilise pas l'apprentissage par renforcement, comme le fait ChatGPT, de sorte que les réponses "peuvent être de qualité variable et peuvent potentiellement inclure un langage et des opinions offensants".

On ne sait pas si les modèles StableLM mis à jour qui arrivent peuvent concurrencer ChatGPT. Pour le moment, c'est clairement un travail en cours. Il en était de même pour un autre challenger open source appelé CollosalGPT .

Ce n'est pas la fin de l'histoire, cependant. Stability AI a déclaré que des modèles plus grands avec 15 milliards, 30 milliards et 65 milliards de paramètres sont en cours et devraient aider à affiner les résultats. Un modèle de 175 milliards de paramètres est prévu pour l'avenir. Compte tenu de la taille limitée des modèles disponibles actuellement, StableLM est bien parti.

La nature open source et la mise en œuvre légère de la version alpha de StableLM ont pour objectif de permettre aux développeurs de commencer à travailler sur des applications. Il y a suffisamment de potentiel de croissance et d'amélioration pour qu'il soit intéressant de garder un œil sur ce nouveau chatbot IA.