Tencent lance le grand modèle Hunyuan ! Qu’est-ce que ça fait d’avoir « Jarvis » dans WeChat ?
Le 31 août est destiné à devenir un tournant clé dans l'histoire des grands modèles nationaux. Un certain nombre d'entreprises modèles nationales à grande échelle ont successivement ouvert leurs services au public par le biais de l'enregistrement.
Cela signifie que les grands modèles nationaux sont entrés dans une nouvelle étape : les grands modèles nationaux peuvent fournir des services à des centaines de millions d'utilisateurs et seront également confrontés aux mêmes examens et défis multiples.
Tout à l'heure, Tencent a également officiellement publié son grand modèle de langage à usage général, Hunyuan Large Model, qu'il a lui-même développé.
À l'heure actuelle, Tencent dispose de plus de 50 de ses propres produits et services connectés au grand modèle Hunyuan à des fins de test, notamment Tencent Cloud, Tencent Advertising, Tencent Documents, WeChat Search, QQ Browser, etc. Tencent devrait proposer davantage de produits dans le accès futur.
Comparé à Baidu et Ali, Tencent, en tant que géant national de l'Internet, semble être plus prudent dans les applications de modèles à grande échelle. En fait, AIGC a une très haute priorité au sein de Tencent. Ma Huateng a également déclaré directement l'attitude de Tencent lors de la conférence sur les rapports financiers de Tencent. en mai:
Au départ, nous pensions qu'il s'agissait d'une opportunité qui ne se présenterait qu'une fois par décennie pour Internet, mais plus nous y réfléchissions, plus nous réalisions qu'il s'agissait d'une opportunité qui ne se présenterait jamais dans des centaines d'années, à l'instar de la révolution industrielle. qui a inventé l'électricité. Nous pensons donc que (l'IA) est très importante… mais nous ne sommes pas pressés de le faire plus tôt. Une fois terminé, sortez le produit semi-fini et exposez-le.
Aifan'er a également obtenu des qualifications d'expérience et peut vous fournir plus de détails dans les plus brefs délais.
Grand modèle Hunyuan, donnez-moi plus de conseils s'il vous plaît
À Hunyuan, la vitalité n'est pas divisée et le chaos devient un, ce qui est le début de la vitalité. Le nom montre que Tencent, désireux de « créer de nouvelles choses », fonde de grands espoirs sur le modèle Hunyuan.
En tant que grand modèle de langage universel auto-développé par Tencent sur tous les liens, le grand modèle Hunyuan dispose d'un excellent corpus, d'algorithmes de grand modèle innovants, d'un cadre d'apprentissage automatique Angel auto-développé et d'une infrastructure informatique puissante.
En réponse à des scénarios d'application réels, Jiang Jie, principal représentant de l'équipe R&D du modèle Hunyuan de Tencent et vice-président du groupe Tencent, a également présenté lors de la conférence de presse le modèle Hunyuan, qui s'engage à être plus fiable et plus mature.
Le grand modèle Hunyuan est plus fiable.Après de nombreuses recherches et tentatives, le grand modèle Hunyuan a trouvé une méthode basée sur la détection de la vérité, qui peut réduire efficacement le taux d'hallucinations des grands modèles de langage de 30 à 50 %.
Le grand modèle Hunyuan, plus fiable, peut également identifier les « pièges » et résister aux « inductions », permettant au modèle de dire « non » aux problèmes dangereux.
Face à ce défi, le grand modèle Hunyuan, plus mature, peut gérer la génération et la continuation de textes très longs, comme la rédaction d'un article sur les brevets d'appareils agricoles.
Le grand modèle Hunyuan propose une nouvelle stratégie de chaîne de pensée, qui renforce efficacement la tendance du modèle à réfléchir au démontage et à la distribution des problèmes. La vision de Jiang Jie est que les grands modèles peuvent raisonnablement faire des inférences basées sur des scénarios d'application réels comme ceux des humains.
Jiang Jie a posé des questions au Hunyuan Big Model telles que « Qui êtes-vous, quelle est l'architecture de base du Hunyuan Big Model et quels sont les paramètres du Hunyuan Big Model ? » On peut voir que les réponses du Hunyuan Big Model sont pleines de questions. .
Il convient de noter que le grand modèle Hunyuan sera mis à jour jusqu'en juillet 2023 et qu'il est toujours en cours d'itération.
Afin de démontrer la capacité de raisonnement logique du modèle Hunyuan, Jiang Jie a posé au modèle Hunyuan une question de réflexion logique : « J'ai acheté un tas de café, j'en ai bu la moitié le matin et j'ai bu la moitié restante l'après-midi. Il reste encore 30 tasses. J'en ai acheté un total de Combien de tasses avez-vous bu ?" En très peu de temps, le grand modèle Hunyuan a donné la bonne réponse.
Comparé aux grands modèles traditionnels axés sur les paramètres et l'évaluation, le grand modèle Hunyuan de Tencent se concentre davantage sur les applications.
Par exemple, lorsqu'il est combiné avec Tencent Conference, le grand modèle Hunyuan peut générer un résumé de l'ensemble de la conférence et organiser les détails pertinents de la conférence.
En combinaison avec Tencent Documents, la conférence de presse a également démontré les capacités d'induction de texte, de création et d'édition de documents, de traduction et autres du grand modèle Hunyuan. Il peut maîtriser des dizaines de scénarios de génération de texte et générer facilement des graphiques Excel basés sur des centaines de formules.
En combinaison avec Tencent Advertising, le grand modèle Hunyuan s'adapte aux caractéristiques industrielles et régionales, répond aux besoins de milliers de personnes et réalise l'intégration naturelle du texte, des images et des vidéos. L'effet de génération de publicité dépasse le Midjourney traditionnel avec une adoption par les utilisateurs. taux de 42 %, de loin. Bien plus que le modèle open source de diffusion stable.
Sur la piste des grands modèles d’IA, la mise en page de Tencent est en fait bien antérieure.
En 2019, Tencent a lancé un vaste modèle de recommandation publicitaire MoE, avec des paramètres de modèle unique dépassant 100 milliards.
En 2021, Tencent a lancé un modèle NLP à grande échelle, à l'échelle de 100 milliards, qui a considérablement amélioré l'efficacité de la formation et du raisonnement des modèles et réduit les coûts.
À l'aube de 2022, le grand modèle Hunyuan accumulé depuis longtemps a inauguré la saison des récoltes. En mai, le grand modèle Hunyuan AI a simultanément dominé le classement général CLUE, la compréhension écrite et les listes de graphiques de connaissances à grande échelle, battant trois records d'un seul coup.
Un mois plus tard, le grand modèle d'IA multimodale de Tencent a été utilisé pour la première fois dans la publicité, ce qui a entraîné une augmentation cumulée de 15 % du GMV pour les annonceurs.
Ces accumulations ont jeté les bases du grand modèle Hunyuan.
Première expérience du grand modèle Tencent Hunyuan
La page d'accueil de "Tencent Hunyuan Assistant" se compose de deux onglets : "Chat" et "Inspiration Discovery". La fonction "Chat" est similaire aux produits d'IA conversationnelle. Différent de ChatGPT, "Tencent Hunyuan Assistant" a intégré de nombreuses commandes. et vous recommandera quelques questions sur la page d'accueil.
Je travaillais sur le manuscrit lors de la conférence de presse, alors j'ai aussi essayé de le laisser écrire le manuscrit pour voir si cela pouvait me faire gagner du temps (moyu).
« Inspiration Discovery » intègre des applications pour de nombreux scénarios courants dans différents secteurs, notamment le travail, la programmation, le marketing, la vie, les jeux de rôle, le divertissement et d'autres domaines.
Vous pouvez directement le laisser générer du code et écrire une copie de départ, ou vous pouvez également le laisser jouer différents rôles. Par exemple, pour les nouveaux parents, vous pouvez directement cliquer sur « Expert en éducation » pour fournir des conseils pratiques sur divers problèmes rencontrés par les enfants à différentes étapes. .suggestion.
Les enregistrements dans « Chat » et « Inspiration Discovery » peuvent être consultés en cliquant sur l'icône de menu dans le coin supérieur gauche de la page d'accueil. Concernant la question des données des utilisateurs, nous avons également vu dans l’accord de confidentialité que Tencent promettait de ne pas enregistrer ces conversations pour la formation réelle des modèles des utilisateurs.
Pour plus de fonctions et de détails sur "Tencent Hunyuan Assistant", veuillez prêter attention à notre expérience plus détaillée à l'avenir. Quelle expérience de fonction vous intéresse le plus ? Vous êtes également invités à nous le dire dans la zone de commentaires.
Un grand modèle domestique qui tourne à toute allure
Les entrepreneurs Internet transfrontaliers nationaux espèrent tous saisir cette opportunité qui pourrait être plus grande que l'Internet mobile, et l'engouement pour l'entrepreneuriat à grande échelle est en plein essor.
Depuis le poste de héros de l'IA du co-fondateur de Meituan, Wang Huiwen, pour construire l'OpenAI en Chine, les grandes entreprises Internet et technologiques sont désormais pleinement impliquées dans cette compétition.
Wenxinyiyan de Baidu, Tongyi Qianwen d'Alibaba, la marque Hunyuan de Tencent et ByteDance ont également récemment testé publiquement l'application à grande échelle « Doubao ». Lors des récentes conférences des fabricants de téléphones mobiles, du lancement du Huawei Hongmeng 4 et du discours annuel de Lei Jun, les grands modèles sont également devenus les protagonistes.
Cependant, qu'il s'agisse de ChatGPT ou d'un grand nombre de grands modèles nationaux et étrangers, il n'existe pas vraiment d'application « qui tue » pour les utilisateurs ordinaires. La voie vers la commercialisation n'est pas encore mûre. À l'heure actuelle, le bénéfice évident de l'AIGC wave continue de "vendre des pelles" de NVIDIA.
Par conséquent, la manière dont Tencent, qui compte 1,33 milliard d'utilisateurs actifs mensuels de WeChat, combine des applications modèles à grande échelle avec une vaste expérience d'utilisateur final C a naturellement attiré davantage d'attention. Une telle taille est également une raison importante pour laquelle Tencent ne peut pas se précipiter pour lancer des produits semi-finis. des produits.
Quant aux deux produits de Tencent les plus utilisateurs, WeChat et QQ, on ne sait toujours pas s'ils seront connectés au modèle Hunyuan et quand, mais Jiang Jie a déclaré que l'équipe faisait déjà des progrès.
En fait, Tencent ne tarde pas à déployer de grands modèles : actuellement, les deux startups de grands modèles les plus appréciées en Chine, Lightyear Beyond et MiniMax, coopèrent également avec Tencent.
Parmi eux, MiniMax, créé il y a moins de 2 ans, a lancé en mars de cette année une plate-forme ouverte API pour les utilisateurs d'entreprise, prenant en charge les appels de service de modèles de texte et de parole. Il est devenu le grand modèle sous-jacent de Douyin Volcano Engine et Kingsoft WPS. AI, et fait également partie du premier lot à passer le cap de l'une des grandes sociétés modèles enregistrées, avec une valorisation de 1,2 milliard de dollars américains.
Avant de lancer le grand modèle Hunyuan, Tencent Cloud avait lancé en juin un grand modèle industriel pour les clients B-end, couvrant 10 secteurs majeurs tels que la finance, le tourisme culturel, les affaires gouvernementales, les médias et l'éducation, et fournissant plus de 50 solutions.
Lu Qi, fondateur et PDG de Qiji Chuangtan, estime qu'il n'existe que deux pays et régions dans le monde qui possèdent les capacités de base de la grande industrie du mannequinat, à savoir l'Amérique du Nord et la Chine. Il a mentionné dans son discours précédent qu’il existe trois facteurs clés pour que les grands modèles chinois rattrapent OpenAI :
La première consiste à construire un modèle de base, qui consiste à grimper jusqu'à GPT-3.5.
Le deuxième est de développer la capacité d’industrialiser les modèles.
Le troisième est le développement de plateformes et l’établissement écologique.
Si vous prêtez un peu attention aux développements récents de ChatGPT, OpenAI fait également des efforts sur trois aspects. Une fois le premier lot de modèles chinois à grande échelle enregistrés, les deuxième et troisième lots ne seront peut-être pas loin. Chaque entreprise se précipite vers les modèles à grande échelle et a organisé la « Guerre des Cent Régiments » à l'ère des modèles à grande échelle. , mais cette course de fond ne fait que commencer.
Qu'il s'agisse de l'évolution de l'industrie technologique de l'Internet ou de l'avenir d'un travailleur ordinaire, peut-être en 2023, les indices ont déjà été posés.
# Bienvenue pour suivre le compte public officiel WeChat d'aifaner : aifaner (ID WeChat : ifanr). Un contenu plus passionnant vous sera fourni dès que possible.
Ai Faner | Lien original · Voir les commentaires · Sina Weibo