Baidu Wenxin Yiyan a fait ses débuts ! Je ne peux pas encore correspondre à ChatGPT, mais ne soyez pas déçu

L'IA est vraiment à la mode ces jours-ci.

OpenAI s'appuie sur la force de ChatGPT pour attirer l'attention, et Google a suivi avec Bard Hier encore, le modèle GPT-4 a de nouveau volé la vedette. Tu viens de chanter sur le domaine de l'IA où j'ai fait mes débuts. Aujourd'hui, c'est au tour de Baidu.

Juste cet après-midi, le très attendu Baidu Wenxin est arrivé comme prévu. Cependant, au début de la conférence de presse, le PDG de Baidu, Robin Li, a donné une chance à tout le monde :

En un sens, Baidu s'y prépare (en publiant Wenxin Yiyan) depuis de nombreuses années. Nous avons commencé à investir dans la recherche sur l'IA il y a plus de dix ans et avons lancé le grand modèle de langage Wenxin en 2019. Wenxin Yiyan d'aujourd'hui est une continuation des efforts des dernières années.

Mais on ne peut pas dire que nous sommes complètement prêts. Wenxin a déclaré que le seuil de référence par rapport à ChatGPT, ou même GPT-4, est très élevé. Aucun grand fabricant mondial n'a encore réussi, et Baidu est le premier. Mon propre test sent qu'il y a encore beaucoup d'imperfections.

Comment le retardataire Wen Xin Yiyan s'est-il comporté ? Quel est l'écart avec ChatGPT ? Peut-il répondre à la demande du marché pour les grands modèles en langue chinoise ? Nous en avons fait une analyse complète.

Nous publierons également le site Web pour des tests internes  https://cloud.baidu.com/survey_summit/wenxin.html?track=C816552

Que peut faire une nouvelle génération de grands modèles de langage et de produits d'IA générative ?

Cinq points clés :

  • Écriture créative;
  • Création de rédaction d'entreprise;
  • Calculs mathématiques et logiques;
  • Compréhension chinoise;
  • Génération multimodale.

Pour ces cinq scénarios, Robin Li a fait respectivement des démonstrations. Il convient de mentionner que ces démonstrations ne sont pas des opérations en direct, mais des enregistrements.

Le premier est la capacité de création littéraire de Wen Xin Yi Yan. Li Yanhong a continuellement soulevé plusieurs questions liées au "problème des trois corps" à Wen Xin Yi Yan.

Tout d'abord, d'après la vidéo de démonstration, la vitesse de réponse de Wenxinyiyan est très rapide, beaucoup plus rapide que ChatGPT, et le contenu qui en sort est assez bon. Plus tard, nous poserons les mêmes questions à ChatGPT et Bing Chat. Jetons un coup d'œil à trois différences entre le

▲L'animation n'est pas accélérée

Concernant la création de copywriting commerciaux, Li Yanhong a posé une question à Wen Xin :

Si vous souhaitez créer une société de services technologiques qui utilise de grands modèles pour servir la mise à niveau numérique des petites et moyennes entreprises, quel nom de société pouvez-vous choisir ?

Voici son Q&A.

Sans oublier, c'est assez décent.

Il peut également être utilisé pour générer des communiqués de presse.On peut dire que l'IA est utilisée du début à la fin, ce qui est conforme au positionnement de cette entreprise.

Lors de la séance de déduction logique mathématique, Baidu a posé une question sur les poulets et les lapins dans la même cage. Wen Xin a d'abord découvert que la question était fausse, puis a changé la question et a pu y répondre avec précision.

Avant la sortie de Wenxin Yiyan, certaines personnes avaient deviné que ce modèle de langage serait meilleur que OpenAI, Google et Microsoft, alors Baidu a également montré ses compétences dans cette partie. Wenxin Yiyan a non seulement répondu avec précision à la signification de l'idiome "Luoyang Zhigui " , a également expliqué le phénomène financier derrière cela, et a finalement écrit un poème acrostiche tibétain en utilisant cet idiome.

Li Yanhong a également mentionné sur les lieux que le chinois est l'avantage de Wen Xin Yi Yan, et inversement, l'analyse de documents en anglais est devenue son inconvénient.

Enfin, la capacité de génération multimodale de Wenxin Yiyan est introduite. Dessiner des images, écrire de longs textes et générer de courts contenus vidéo basés sur des textes sont tous complétés un par un. C'est une capacité que ChatGPT n'a pas.

▲ Il peut également générer une voix dialectale

Li Yanhong a également mentionné que Baijiahao utilise déjà les capacités de génération multimodale de Wenxin Yiyan pour convertir le contenu textuel en vidéos.

Après la réunion, le premier groupe d'utilisateurs peut d'abord découvrir Wenxin Yiyan grâce au code de test interne fourni par Baidu. Nous avons soumis l'application de test interne et vous apporterons du contenu d'expérience dès que possible à l'avenir.

Avant cela, nous avons transmis les différentes scènes présentées lors de la réunion à ChatGPT (version 3.5) et Bing Chat respectivement pour voir comment elles s'affichent.

Par rapport à ChatGPT&Bing Chat, quelle est l'expérience de Wenxin Yiyan ?

Au cours de la démonstration, Li Yanhong a souligné à plusieurs reprises que Baidu occupe une position unique dans le traitement de la langue chinoise.

Par rapport à ChatGPT et Bing Chat, la plus grande différence est désormais la génération multimodale, c'est-à-dire que les affiches, la voix et même le contenu vidéo peuvent être générés par le biais du langage.

Lors de la présentation de la conférence de presse, Li Yanhong a démontré l'utilisation de Wenxin Yiyan pour générer des affiches d'événement, des voix en dialecte et générer des vidéos liées à l'événement en fonction du contenu des questions. Cependant, le coût de génération de la vidéo est relativement élevé et elle n'est pas encore ouverte à tous les utilisateurs à ce stade.

La capacité de générer des images et des vidéos a vraiment fait briller nos yeux. Robin Li a également déclaré : « L'IA générative multimodale est une tendance de développement claire.

En plus de cette fonctionnalité, nous sommes également curieux de connaître d'autres fonctionnalités par rapport à ChatGPT et Bing Chat, nous avons donc utilisé le contenu présenté lors de la conférence de presse pour poser des questions sur ChatGPT (version 3.5) et Bing Chat. Permettez-moi de parler d'abord de la conclusion : les performances de Wenxinyiyan dans le domaine chinois sont en effet meilleures que les deux prédécesseurs ChatGPT et Bing Chat.

La première est la question sur "Le problème des trois corps". Bing Chat et Wenxin Yiyan peuvent répondre correctement à la question de savoir qui est l'auteur et d'où il vient, tandis que ChatGPT a mal qualifié la ville natale de Liu Cixin de Shandong.

Fait intéressant, la source d'information pour Bing Chat est Baidu Baike.

Quant aux acteurs de la série télé "Three-Body Problem" qui sera mise en scène début 2023, ChatGPT, dont la base d'informations est bloquée en 2021, se dégonfle à nouveau, affirmant que la série télé "Three-Body Problem" n'a pas encore a commencé le tournage, tandis que Bing Chat a trouvé la réponse à Douban.

En termes de rédaction commerciale, tous les trois peuvent donner leur avis.ChatGPT a également judicieusement attaché un nom anglais, ce qui nous convient pour entrer sur le marché international.

Cependant, Bing Chat a mal identifié le sens de la question lors de la première demande et ne m'a pas donné le nom exact de l'entreprise, mais a fourni une solution sur la façon de choisir un nom d'entreprise.

Quant à savoir lequel des trois noms est le meilleur, je laisse à chacun le soin de juger.

Qu'il s'agisse de ChatGPT ou de Bing Chat, ils ne nous donnent pas une totale tranquillité d'esprit lorsque nous résolvons des problèmes de mathématiques, mais le problème du poulet et du lapin dans la même cage mentionné dans la conférence de presse de Baidu ne les a pas dérangés, et ils y ont tous deux répondu avec précision.

En revanche, je préfère l'interprétation de Bing Chat, qui ressemble plus à un enseignant persuasif, et la réponse de Wen Xinyiyan est un peu comme une réponse de référence après les cours.

En termes de compréhension du chinois, les avantages du Wenxinyiyan se reflètent.

Quand j'ai demandé "Quel était le prix du journal à Luoyang à cette époque", ChatGPT a pensé à tort que je demandais le prix de la dynastie Tang et m'a dit que le journal à Luoyang n'était pas cher du tout. Il n'y avait aucun problème avec L'identification de Bing Chat, mais il n'a pas fourni de données précises.

Et le prix de Wenxin de deux à trois mille Wen est au moins cohérent avec les données que j'ai obtenues de la recherche.

Je crois que vous avez également remarqué que, sans parler du contenu de l'écriture, ni ChatGPT ni Bing Chat ne comprennent ce que sont les acrostiches tibétains.En comparaison, la performance de Baidu Wenxin Yiyan est en effet remarquable.

Bien sûr, une telle comparaison est injuste pour ChatGPT et Bing Chat.Après tout, nous n'avons pas officiellement connu Wenxinyiyan, et ce n'est qu'une comparaison avec la présentation lors de la conférence de presse. Après avoir eu l'occasion de tester, nous ferons l'expérience de Wenxinyiyan pour la première fois et nous verrons comment nous nous comportons à ce moment-là.

Li Yanhong a également mentionné lors de la conférence de presse que bien que la langue chinoise présente des avantages évidents, Wenxinyiyan ne s'est pas suffisamment entraîné pour les langues anglaises et les scénarios de code, et ses performances ne sont pas assez bonnes. Je pense que Baidu s'améliorera rapidement à l'avenir.

Gardez les pieds sur terre et regardez les étoiles

Il ne fait aucun doute que la sortie de Wenxin Yiyan est un événement marquant pour l'Internet chinois.

Comme Li Yanhong l'a dit au début, Baidu est le premier grand fabricant à produire un produit qui peut être comparé à ChatGPT, et a réalisé une percée dans le produit génératif d'IA à grand modèle en langue chinoise à partir de zéro.

Mais d'un autre côté, nous devons également examiner correctement l'écart entre Wenxinyiyan et ChatGPT.

Ce que nous appelons ChatGPT aujourd'hui, ou le modèle de langage GPT-4 sous-jacent, a pris 5 ans et 4 itérations pour achever le processus du changement quantitatif au changement qualitatif. Il est presque impossible pour Wen Xinyiyan de rattraper son retard en si peu de temps.

À en juger par la conférence de presse d'aujourd'hui, Wenxinyiyan n'est pas un produit révolutionnaire comme les gens s'y attendaient, mais plutôt un test à mi-parcours des réserves technologiques d'IA de Baidu, montrant que Baidu a également la capacité de poursuivre la recherche et le développement des produits d'intelligence artificielle les plus avancés. .

Après son ouverture au public, Wenxinyiyan peut apprendre et s'améliorer grâce à un grand nombre de requêtes de recherche d'utilisateurs, afin d'améliorer la précision et la rapidité de traitement des problèmes correspondants. Sur ChatGPT, nous avons vu la vitesse à laquelle les modèles de langage d'IA évoluent.

Si vous avez également hâte de voir une vraie "version chinoise de ChatGPT", autant donner du temps et de la patience à Wen Xin. Trois jours après les adieux, on devrait se regarder avec admiration, surtout pour les modèles d'IA.

Coupez la merde.

#Bienvenue pour prêter attention au compte public WeChat officiel d'Aifaner : Aifaner (WeChat ID : ifanr), un contenu plus excitant vous sera présenté dès que possible.

Ai Faner | Lien d'origine · Voir les commentaires · Sina Weibo