Tencent lance le modèle Hunyuan ! Qu’est-ce que ça fait d’avoir un « Jarvis » dans WeChat ?
Le 31 août est destiné à devenir un tournant clé dans l’histoire des modèles nationaux à grande échelle. Un certain nombre d'entreprises modèles nationales à grande échelle ont battu le record et ont progressivement ouvert leurs services au public.
Cela signifie que les modèles nationaux à grande échelle sont entrés dans une nouvelle étape : les modèles nationaux à grande échelle peuvent fournir des services à des centaines de millions d'utilisateurs et seront également confrontés aux mêmes multiples examens et défis.
Tout à l'heure, Tencent a également officiellement publié un grand modèle de langage à usage général auto-développé – le grand modèle Hunyuan.
À l'heure actuelle, Tencent propose plus de 50 produits et services indépendants connectés aux tests de modèles à grande échelle Hunyuan, notamment Tencent Cloud, Tencent Advertising, Tencent Documents, WeChat Souyisou, QQ Browser, etc. Tencent s'attend à avoir davantage de produits à l'avenir. accéder.
Comparé à Baidu et Ali, Tencent, en tant que géant national de l'Internet, semble être plus prudent dans l'application de grands modèles. En fait, AIGC a une très haute priorité au sein de Tencent. Ma Huateng a également exprimé directement l'attitude de Tencent lors de la réunion sur le rapport financier de Tencent. en mai:
Au début, nous pensions qu'il s'agissait d'une opportunité unique pour Internet, mais plus nous y réfléchissions, plus nous sentions qu'il s'agissait d'une opportunité qui ne se présenterait qu'une fois tous les centaines d'années, semblable à la révolution industrielle. qui a inventé l'électricité, nous pensons donc que (l'IA) est très importante… mais nous ne sommes pas pressés de le faire tôt. Une fois terminé, sortez le produit semi-fini pour l'exposer.
Ai Faner a également obtenu la qualification d'expérience et vous fournira plus de détails dans un premier temps.
Grand modèle Hunyuan, donnez-moi plus de conseils s'il vous plaît
Pour ceux qui sont mélangés, la vitalité n'est pas divisée, et le chaos est un, qui est le début de la vitalité. Le nom montre que Tencent, désireux de « s'ouvrir sur le monde », fonde de grands espoirs sur le modèle Hunyuan.
En tant que grand modèle de langage à usage général développé par l'auto-développement à liaison complète de Tencent, le grand modèle Hunyuan possède un excellent corpus, un algorithme de modèle innovant à grande échelle, un cadre d'apprentissage automatique Angel auto-développé et une puissante infrastructure de puissance de calcul. .
Pour les scénarios d'application réels, Jiang Jie, représentant de la principale équipe R&D de Tencent Hunyuan Large Model et vice-président du groupe Tencent, a également démontré lors de la conférence de presse qu'il s'engage en faveur d'un Hunyuan Large Model plus fiable et plus mature.
Le grand modèle Hunyuan est plus fiable.Après de nombreuses recherches et essais, le grand modèle Hunyuan a trouvé une méthode basée sur le sondage, qui peut réduire efficacement le taux d'hallucinations du grand modèle de langage de 30 à 50 %.
Le grand modèle Hunyuan, plus fiable, peut également identifier les « pièges », résister à « l'induction » et laisser le modèle dire « non » aux problèmes dangereux.
Face aux défis, le modèle hybride plus mature peut gérer la génération et la continuation de textes très longs, comme la rédaction d'un article sur les brevets d'appareils agricoles.
Le grand modèle Hunyuan propose une nouvelle stratégie de chaîne de pensée, qui renforce efficacement la tendance du modèle à démonter et à réfléchir aux problèmes. La vision de Jiang Jie est que les grands modèles peuvent faire des déductions raisonnables en combinaison avec des scénarios d'application réels comme ceux des humains.
Jiang Jie a demandé au modèle Hunyuan : « Qui êtes-vous, quelle est la structure de base du modèle Hunyuan et quels sont les paramètres du modèle Hunyuan ? » On peut voir que la réponse du modèle Hunyuan est pleine de questions. .
Il convient de noter que le grand modèle Hunyuan sera mis à jour jusqu'en juillet 2023 et qu'il est toujours en itération.
Afin de démontrer la capacité de raisonnement logique du grand modèle Hunyuan, Jiang Jie a posé au grand modèle Hunyuan une question de réflexion logique : « J'ai acheté un tas de café, j'en ai bu la moitié le matin et j'ai bu la moitié restante l'après-midi. . Il reste encore 30 tasses. Combien de tasses as-tu bu ?" En très peu de temps, le grand modèle Hunyuan a donné la bonne réponse.
Par rapport aux modèles à grande échelle traditionnels axés sur les paramètres et l'évaluation, les modèles à grande échelle de Tencent Hunyuan accordent davantage d'attention aux applications.
Par exemple, en combinaison avec la réunion Tencent, le grand modèle Hunyuan peut générer un résumé de l'ensemble de la réunion et trier les détails pertinents de la réunion.
En combinaison avec les documents Tencent, la conférence de presse a également démontré les capacités d'induction de texte, de création et d'édition de documents et de traduction du grand modèle Hunyuan, maîtrisé des dizaines de scénarios de génération de texte et généré facilement des graphiques Excel basés sur des centaines de formules.
En combinaison avec Tencent Advertising, Hunyuan Large Model s'adapte aux caractéristiques de l'industrie et de la région, répond aux besoins de milliers de personnes et réalise l'intégration naturelle du texte, des images et des vidéos. L'effet de génération de publicité dépasse le Midjourney grand public avec un taux d'adoption par les utilisateurs. de 42 %, bien au-delà du modèle open source de diffusion stable.
Sur la voie des grands modèles d'IA, la mise en page de Tencent est en réalité bien antérieure.
En 2019, Tencent a lancé un grand modèle de recommandation publicitaire MoE, avec un seul paramètre de modèle dépassant 100 milliards.
En 2021, Tencent lancera un grand modèle NLP à l'échelle de 100 milliards, qui améliorera considérablement l'efficacité de la formation et du raisonnement des modèles et réduira les coûts.
À l'aube de 2022, le grand modèle Hunyuan, qui a accumulé beaucoup de temps, a inauguré la saison des récoltes. En mai, le grand modèle Hunyuan AI était simultanément en tête des trois listes du classement général CLUE, de la compréhension en lecture et des graphiques de connaissances à grande échelle, battre trois records d'un seul coup.
Un mois plus tard, le grand modèle d'IA multimodale de Tencent a été appliqué pour la première fois à la publicité, et à cette époque, il a entraîné une augmentation cumulée de 15 % du GMV pour les annonceurs.
Ces accumulations ont jeté les bases du grand modèle Hunyuan.
Première expérience du grand modèle Tencent Hunyuan
La page d'accueil de "Tencent Hunyuan Assistant" se compose de deux onglets, "Chat" et "Inspiration Discovery". La fonction "Chat" est similaire aux produits d'IA conversationnelle. Contrairement à ChatGPT, "Tencent Hunyuan Assistant" a intégré de nombreuses commandes en même temps. , certaines questions vous seront proposées sur la page d'accueil.
Je me précipitais pour écrire le manuscrit lors de la conférence de presse, et j'ai aussi essayé de le laisser écrire le manuscrit pour voir si cela pouvait me faire gagner du temps (moyu).
Dans « Inspiration Discovery », il intègre les applications de nombreux scénarios courants dans différents secteurs, notamment le travail, la programmation, le marketing, la vie, les jeux de rôle, le divertissement et d'autres domaines.
Vous pouvez directement le laisser générer du code, écrire des copies de base ou le laisser jouer différents rôles. Par exemple, pour les parents novices, vous pouvez directement cliquer sur « Expert en éducation », et divers problèmes rencontrés par les enfants à différents stades peuvent recevoir des conseils pratiques. suggestion.
Les enregistrements dans « Chat » et « Inspiration Discovery » peuvent être consultés en cliquant sur l'icône de menu dans le coin supérieur gauche de la page d'accueil. Concernant la question des données des utilisateurs, nous avons également vu dans l'accord de confidentialité que Tencent s'engage à ne pas enregistrer ces conversations pour la formation réelle des modèles des utilisateurs.
Pour plus de fonctions et de détails sur « Tencent Hunyuan Assistant », veuillez prêter attention à notre expérience de suivi plus détaillée, à l'expérience de fonction qui vous intéresse le plus, et n'hésitez pas à nous le dire dans la zone de commentaires.
Le grand modèle domestique se déchaîne
Les entrepreneurs de l'Internet transfrontalier national veulent tous saisir cette opportunité qui pourrait être plus grande que l'Internet mobile, et l'essor de l'entrepreneuriat à grande échelle est en plein essor.
Depuis que Wang Huiwen, co-fondateur de Meituan, a publié un article sur l'intelligence artificielle pour construire l'OpenAI chinoise, toutes les grandes entreprises Internet et technologiques sont désormais pleinement impliquées dans cette compétition.
Wenxin Yiyan de Baidu, Tongyi Qianwen d'Ali, le grand modèle Hunyuan de Tencent et ByteDance ont également testé publiquement l'application de grand modèle « Doubao » il n'y a pas si longtemps. Lors des récentes conférences de presse des fabricants de téléphones mobiles, du lancement du Huawei Hongmeng 4 et du discours annuel de Lei Jun, les grands modèles sont également devenus les protagonistes.
Cependant, qu'il s'agisse de ChatGPT ou d'un grand nombre de grands modèles nationaux et étrangers, il n'y a pas vraiment d'application « tueuse » pour les utilisateurs ordinaires, et la voie de commercialisation n'a pas encore mûri. À l'heure actuelle, le bénéfice évident de l'AIGC wave continue de "vendre des pelles" de Nvidia.
Par conséquent, Tencent, qui compte 1,33 milliard d'utilisateurs actifs mensuels de WeChat, attire naturellement davantage l'attention sur la façon de combiner des applications modèles à grande échelle avec une énorme expérience utilisateur final C. Un tel volume est également une raison importante pour laquelle Tencent ne peut pas se précipiter pour lancer produits semi-finis.
Quant aux deux produits de Tencent qui comptent le plus d'utilisateurs – WeChat et QQ, on ne sait toujours pas si et quand ils seront connectés au modèle Hunyuan, mais Jiang Jie a déclaré que l'équipe progressait déjà.
En fait, la mise en place de Tencent sur les modèles à grande échelle n'est pas lente.À l'heure actuelle, les deux plus grandes start-ups de modèles à grande échelle avec la valorisation la plus élevée en Chine – Années-lumière au-delà et MiniMax coopèrent également avec Tencent.
Parmi eux, MiniMax, créé il y a moins de 2 ans, a lancé en mars de cette année une plate-forme ouverte API pour les utilisateurs d'entreprise, prenant en charge les appels de service pour les modèles de texte et de voix. Il est devenu le grand modèle sous-jacent de Douyin Volcano Engine et Kingsoft WPS. AI : l’une des plus grandes sociétés modèles jamais enregistrées, avec une valorisation de 1,2 milliard de dollars.
Avant de lancer le modèle Hunyuan, Tencent Cloud avait lancé en juin un modèle industriel pour les clients B-end, couvrant 10 secteurs majeurs tels que la finance, le tourisme culturel, les affaires gouvernementales, les médias et l'éducation, et proposant plus de 50 solutions.
Lu Qi, fondateur et PDG de Qiji Chuangtan, estime qu'il n'existe que deux pays et régions dans le monde qui possèdent les capacités de base de l'industrie du modélisme à grande échelle, à savoir l'Amérique du Nord et la Chine. Dans son discours précédent, il a mentionné qu'il y avait trois éléments clés pour que le grand modèle chinois rattrape OpenAI :
La première consiste à construire le modèle de base, qui consiste à passer à GPT-3.5.
Le deuxième est de développer la capacité d’industrialiser les modèles.
Le troisième est le développement de plateformes et l’établissement écologique.
Si vous prêtez attention aux développements récents de ChatGPT, OpenAI travaille également dans trois directions. Une fois que le premier lot de produits chinois de modèles à grande échelle aura passé le dépôt, les deuxième et troisième lots ne seront peut-être pas loin. Toutes les entreprises se précipitent pour obtenir des modèles à grande échelle et ont organisé la « Guerre des Cent Régiments » du modèle à grande échelle. époque, mais cette course de fond ne fait que commencer.
Qu'il s'agisse du modèle de l'industrie technologique de l'Internet ou de l'avenir des travailleurs migrants ordinaires, peut-être qu'en 2023, des couleuvres et des lignes grises auront été tracées.
#Bienvenue pour prêter attention au compte public officiel WeChat d'Aifaner : Aifaner (WeChat ID : ifanr), un contenu plus passionnant vous sera présenté dès que possible.
Ai Faner | Lien original · Voir les commentaires · Sina Weibo