La version open source de ChatGPT arrive-t-elle ? Cette équipe d’artefacts de dessin d’IA veut que tout le monde puisse créer ses propres grands modèles

26 avril 2023 Hibou Gourou

Le modèle open source Stable Diffusion publié par Stability.ai peut être considéré comme l'un des modèles de peinture AI les plus courants et les plus importants à l'heure actuelle.

Basé sur l'open source Stable Diffusion, la communauté des développeurs a créé de nombreux plug-ins et modèles intéressants, tels que le projet Control Net qui peut contrôler la forme des graphiques, et plus de 1 000 projets de développement connexes.

Maintenant, cette société d'intelligence artificielle qui aime l'open source veut faire une autre grande chose : publier un grand modèle de langage open source similaire à ChatGPT.

Tout le monde a un LLM

On peut dire que 2023 est une année d'explosion pour les grands modèles de langage.Au cours des derniers mois, un nouveau grand modèle de langage a été publié presque chaque semaine. Grands modèles, petits modèles, génération de texte, multimodal, source fermée, open source… C'est le printemps des grands modèles de langage, et toutes sortes d'écoles fleurissent.

Cet enthousiasme n'appartient pas seulement aux entreprises Internet telles que Microsoft, Google, Baidu et Ali, mais également à toutes les entreprises technologiques liées à l'IA.

Par rapport aux grands modèles existants, quelle est la particularité du grand modèle de langage StableLM publié par Stability.ai ?

Selon Stability.ai, StableLM est actuellement un modèle open source et transparent qui permet aux chercheurs et aux développeurs d'inspecter, d'utiliser et de modifier librement le code. Tout comme Stable Diffusion, les utilisateurs peuvent librement configurer Stable LM pour créer un grand modèle de langage adapté à leurs besoins.

Le modèle actuel de la version Stable LM Alpha a une taille de paramètre de 3 milliards et 7 milliards. À l'avenir, Stability.ai fournira également des versions de modèle avec une taille de paramètre de 15 milliards et 65 milliards.

Bien que la taille du modèle de StableLM soit beaucoup plus petite que les 175 milliards de paramètres du modèle GPT-3, Stability.ai a déclaré que StableLM est basé sur un ensemble de données étendu qui est 3 fois plus grand que l'ensemble de données The Pile. le dialogue a une bonne performance.

L'ensemble de données Pile lui-même comprend déjà un grand nombre de livres, une base de connaissances Github, des pages Web, des enregistrements de chat et d'autres données, et collecte également des articles en médecine, physique, mathématiques, informatique et philosophie, qui peuvent être utilisés pour le grand langage général. modèles et génération de textes inter-domaines La formation fournit une bonne base de référence.

Par conséquent, en utilisation réelle, l'écart entre StableLM et GPT-3 n'est pas aussi évident que la différence dans les données de paramètres papier.

Dans l'annonce, Stability.ai a montré les performances réelles de StableLM dans la gestion de trois tâches différentes, notamment la rédaction d'e-mails et l'écriture de paroles de rap (question : écrire une bataille épique dans laquelle le réseau d'apprentissage en profondeur et l'intelligence artificielle symbolique interagissent. On ne peut que dire trop geek) et écrire du code.

Stability.ai héberge également StableLM sur le site de la communauté HuggingFace. Les amis qui veulent en faire l'expérience en premier peuvent se rendre à l'adresse suivante pour y jouer

https://huggingface.co/spaces/stabilityai/stablelm-tuned-alpha-chat

À en juger par le court test que nous avons effectué, le niveau de chinois de StableLM n'est pas aussi bon que celui de Guo Jierui, et encore moins par rapport aux meilleurs étudiants comme ChatGPT, alors essayez d'utiliser l'anglais lorsque vous parlez.

Débat open source ou open source

Comme de nombreux grands modèles de langage open source, y compris Alpaca de l'Université de Stanford, StableLM offre à de nombreux développeurs la possibilité de personnaliser de grands modèles de langage localement ou sur le serveur, sans se soucier de la fuite de vos données vers l'arrière-plan du modèle.

Après que ChatGPT est devenu populaire, les problèmes de confidentialité des données concernant les modèles d'IA sont apparus les uns après les autres. Il n'y a pas si longtemps, Samsung a également été révélé que plusieurs employés avaient divulgué des données confidentielles à ChatGPT, de sorte que le département des semi-conducteurs de Samsung a décidé de développer ses propres outils d'IA internes pour éviter des problèmes similaires. de se reproduire.

En plus des avantages d'une grande transparence, le modèle open source permet aux développeurs d'utiliser plus facilement le modèle open source pour développer des applications plus créatives. Par exemple, vous pouvez personnaliser StableLM pour en faire un rédacteur web non-stop, ou un programmeur senior ou un rédacteur qui connaît très bien les projets de l'entreprise, ou encore un maître d'horoscope sur Weibo.

Le modèle open source donne aux développeurs plus de place pour l'imagination, mais en même temps, il donne également aux auteurs des moyens plus avancés.

Pour ceux qui ont des arrière-pensées, le grand modèle de langage open source peut être un artefact de fraude dans les télécommunications. Ils peuvent tromper les gens avec un dialogue réaliste.

L'open source s'accompagnera toujours de controverses, ce que Stability.ai attend depuis longtemps. Stability.ai a fait l'objet d'un certain nombre de poursuites pour avoir prétendument violé les droits des artistes pour l'open source Stable Diffusion, ainsi que d'une controverse sur les utilisateurs utilisant ses outils pour générer du contenu pornographique.

Emad Mostaque, PDG de Stability.ai, a mentionné dans une précédente interview que les grands modèles doivent recevoir plus de supervision, plutôt que d'être enfermés dans une petite boîte noire par les grandes entreprises, donc l'ouverture à la communauté des grands modèles est également très importante. Stability.ai insiste sur l'open source afin d'apporter la technologie à plus de gens et d'éveiller la réflexion des gens.

StableLM est la dernière validation de la promesse de Stability.ai qu'un avenir où chacun a son propre modèle de langage peut commencer.

Huang Zhijian

Coupez la merde.

Poster

#Bienvenue pour prêter attention au compte public WeChat officiel d'Aifaner : Aifaner (WeChat ID : ifanr), un contenu plus excitant vous sera présenté dès que possible.

Ai Faner | Lien d'origine · Voir les commentaires · Sina Weibo