Affirmant que l’évaluation chinoise surpasse GPT-4, Baichuan Intelligent publie Baichuan 3, un grand modèle avec plus de 100 milliards de paramètres

29 janvier 2024 Hibou Gourou

Les grandes startups « basées à Tsinghua » recrutent à nouveau.

Le 29 janvier, Baichuan Intelligence, fondée par le fondateur de Sogou, Wang Xiaochuan (BS à l'Université Tsinghua), a officiellement publié Baichuan 3, un grand modèle de langage comportant plus de 100 milliards de paramètres. Ce modèle fonctionne non seulement bien dans plusieurs tests faisant autorité, mais surpasse également le GPT-4 dans les indicateurs chinois.

Les résultats des tests montrent que Baichuan 3 atteint un niveau proche de 90 % de GPT-4 dans plusieurs benchmarks anglais tels que MMLU. Dans de nombreux tests de référence chinois tels que CMMLU et GAOKAO, Baichuan 3 est loin devant, dépassant largement GPT-3.5 et dépassant également GPT-4 dans tous les aspects.

Dans les tests de mathématiques et de listes de codes, ainsi que dans l'évaluation de listes alignées telles que MT-Bench et IFEval, Baichuan 3 a surpassé les grands modèles tels que GPT-3.5 et Claude, et est également à la pointe de l'industrie, à peine légèrement. inférieur à GPT-4.

L’IA+médecine est un domaine d’application clé des grands modèles. Les problèmes médicaux sont complexes et changeants, les connaissances sont mises à jour rapidement et les exigences de précision sont élevées, ce qui nécessite que les modèles démontrent pleinement de puissantes capacités de compréhension et de prise de décision en matière de texte, d'images, de sons, etc.

Par conséquent, Baichuan Intelligence le considère comme le « joyau » des grands modèles.

Baichuan 3 a fait l'objet d'une formation et d'une optimisation approfondies dans le domaine médical, et les résultats après formation sont également très significatifs. Ses performances dans les tâches médicales chinoises telles que MCMLE, MedExam et CMExam dépassent celles de GPT-4, et ses performances dans les tâches médicales anglaises des tâches telles que USMLE et MedMCQA sont également proches du niveau GPT-4, remportant d'un seul coup le titre de modèle chinois doté des capacités médicales les plus fortes.

Selon les révélations officielles, afin de renforcer la formation dans ce domaine, Baichuan 3 a construit un ensemble de données médicales de plus de 100 milliards de jetons au cours de la phase de pré-formation du modèle, couvrant tous les aspects des connaissances médicales de la théorie à la pratique pour garantir le professionnalisme et le professionnalisme. dans le domaine médical.Profondeur des connaissances.

Au cours de la phase d'inférence, Baichuan Intelligence optimise les invites à acquérir des connaissances médicales en décrivant avec précision les tâches et en sélectionnant de manière appropriée les échantillons, ce qui rend le modèle plus précis et plus logique.

La compréhension sémantique et la génération de texte sont les capacités sous-jacentes les plus fondamentales des grands modèles et peuvent être considérées comme les piliers fondamentaux des modèles d'intelligence artificielle. Wang Xiaochuan a souligné un jour que le langage est la frontière du monde cognitif humain et que, du point de vue de la mise en œuvre technique, il est plus difficile de percevoir et de comprendre le langage que les images et les vidéos.

Selon lui, Newton a utilisé les trois lois du mouvement pour résumer les lois de l’univers en expressions mathématiques, ce qui constituait un grand pas en avant pour la cognition humaine. Il en va de même pour les plus grands modèles d'aujourd'hui. Maîtriser les lois du langage, c’est maîtriser la connaissance elle-même, ainsi que la pensée humaine, la communication et la culture.

Un modèle de langage est comme une bombe atomique, il pourrait allumer une bombe à hydrogène. Il y aura une meilleure modélisation à l’avenir, et c’est ce que nous devons faire à l’avenir.

La puissante capacité de traitement du chinois de Baichuan 3 est l’un de ses plus grands points forts. Même face à des genres difficiles tels que des paroles de chansons aux formats complexes, aux structures serrées et aux rimes riches, Baichuan 3 peut produire des œuvres avec un contenu soigné, des contrepoints bien alignés et des rimes harmonieuses.

Les responsables ont déclaré que Baichuan 3 combine « RLHF&RLAIF » et des méthodes d'apprentissage itératif par renforcement pour améliorer considérablement la capacité des grands modèles linguistiques dans la création poétique. Par rapport aux autres modèles haut de gamme de l'industrie, sa convivialité de création est multipliée par plus de 5 et ses réalisations littéraires dépassent complètement GPT-4.

▲Lien d'expérience : https://www.baichuan-ai.com/

Par exemple, lors de la démonstration officielle, il a été demandé à Baichuan 3 de générer une chanson sensationnelle sur le « Gongdou Drama » d'OpenAI. Son interprétation d'un mélange de chinois et d'anglais est assez intéressante.

"Défendre la tempête · Rappeler le passé et la tempête changeante"
En regardant le passé, au milieu des changements, le domaine de l’IA est en plein essor. Altman souffre d'une séparation, qui peut l'aider ? Nadella l'aide.
Qu'y a-t-il de mal à ce que d'anciens pairs deviennent des rivaux ? Les griefs et griefs du monde sont dans le ciel. Créons de l'éclat ensemble et avançons main dans la main, sans regrets, et le chemin à parcourir est sans fin.

Il convient de mentionner que Baichuan Intelligence se distingue des autres grandes entreprises modèles par son concept open source. Cela peut être vu dans le discours de Wang Xiaochuan lors de la conférence de presse Baichuan 2.

Llama 2 L'époque du modèle open source est révolue. Nous pouvons désormais obtenir un modèle open source plus convivial et plus performant que Llama, qui peut aider à soutenir le développement de l’ensemble de l’écosystème chinois.

Bien que Llama 2 soit annoncé comme open source, il n'est en réalité disponible que dans l'environnement anglais. En revanche, la série Baichuan 2 est entièrement ouverte aux utilisateurs chinois et propose des services gratuits dans un environnement bilingue chinois-anglais.

Baichuan Intelligent a successivement ouvert quatre modèles de déploiement à faible coût, dont Baichuan-7B, Baichuan-13B, Baichuan2-7B et Baichuan2-13B, prenant en charge de grands modèles en chinois et en anglais.

En outre, lorsque les médias lui ont demandé comment réaliser des modèles open source et commerciaux fermés pour aller de pair et itérer rapidement, Chen Weipeng, co-fondateur de Baichuan Intelligent Technology, a révélé que cela était dû à leur riche expérience en matière de technologie de recherche. peut être rapidement migré et appliqué à de grands modèles.

D'un point de vue technique, la recherche et les grands modèles partagent de nombreux fondements techniques communs. Par exemple, dans le lien clé de traitement des données de la formation du modèle, l'équipe a effectué un filtrage et une optimisation des données sur la base de son expérience dans le domaine de la recherche, réalisant un filtrage répété et améliorant la qualité, fournissant ainsi un support de données de haute qualité pour le modèle.

En septembre de l'année dernière, en parlant de l'écart entre les grands modèles nationaux et ChatGPT, Wang Xiaochuan a porté ce jugement :

GPT-4 s'améliore constamment et a récemment fait beaucoup de bruit avec le lancement des capacités voix et image. D’un point de vue temporel, nous pensons qu’il faudra peut-être deux ou trois ans pour se rapprocher du niveau actuel de GPT-4.

Bien entendu, dans la concurrence féroce entre les grands modèles, il ne suffit pas de rester au stade de l'exploration technologique : la prochaine étape pour Baichuan Intelligence est d'accélérer la transformation de la technologie en scénarios d'application.

Wang Xiaochuan a mentionné à plusieurs reprises en public les « super applications », et il a même prédit qu'il y aurait plusieurs super applications en Chine cette année. Et cela pourrait devenir la prochaine bataille pour les grands modèles.

# Bienvenue pour suivre le compte public officiel WeChat d'Aifaner : Aifaner (WeChat ID : ifanr). Un contenu plus passionnant vous sera fourni dès que possible.

Ai Faner | Lien original · Voir les commentaires · Sina Weibo