Dialogue avec Zhang Peng, PDG de Zhipu AI : La révolution technologique est déjà assez rapide, ne vous concentrez pas uniquement sur les résultats des « super applications »
Lors de la Conférence mondiale sur l'intelligence artificielle de 2024, organisée au bord du fleuve Huangpu, des entrepreneurs, des développeurs et des passionnés de technologie ont libéré un enthousiasme encore plus brûlant que la chaleur de 38 degrés à Shanghai. Opinions sur le caractère révolutionnaire des grands modèles et l'incompatibilité des applications pratiques. est également entré en collision. Créer de nouvelles étincelles.
Comment convertir la puissance de calcul des grands modèles en productivité ?
Lorsque les grands modèles, les puces, le cloud computing, l'intelligence embarquée, la conduite autonome et d'autres fabricants rassemblent les dernières réalisations, formant un paysage miniature du paysage chinois de l'IA, tous ceux qui viennent ici espèrent trouver des bases menant à la ligne grise de Snake.
"C'est l'entreprise qui ressemble beaucoup à OpenAI." J'étais devant le stand de Zhipu AI et j'ai entendu un visiteur de l'exposition le présenter à ses compagnons. C'est probablement l'opinion de nombreux pratiquants.
Cette licorne chinoise à IA propose de grands modèles généraux de différentes tailles. Elle a récemment publié le modèle GLM-4-9B, surpassant le modèle Llama 3 8b. Le modèle multimodal GLM-4V-9B atteint les mêmes capacités que le GPT-4V avec une quantité de paramètres de 13B. Hier, Zhipu AI a également publié le modèle de code CodeGeeX de 4e génération, CodeGeeX4-ALL-9B au WAIC.
Le rythme de commercialisation de Zhipu AI est également en avance sur celui de la plupart de ses concurrents. Aujourd'hui, plus de 300 000 agents actifs dans l'application Qingyan sont disponibles. La plate-forme ouverte à grand modèle Zhipu AI compte actuellement plus de 400 000 utilisateurs enregistrés et le volume d'appels quotidien moyen atteint 60 milliards de jetons.
Zhang Peng, PDG de Zhipu AI, estime que l'engouement actuel pour l'IA provoqué par les grands modèles est différent du passé, la technologie de l'IA a résolu certains problèmes pratiques, mais le développement actuel des grands modèles a apporté une capacité cognitive plus importante. .
Les grands modèles peuvent fournir des capacités de généralisation sur un modèle pour répondre aux divers besoins d'une série de scénarios et d'applications, résolvant ainsi le problème de l'équilibre des coûts et des avantages. C'est sa caractéristique essentielle.
Zhang Peng a également accepté des interviews avec l'APPSO et d'autres médias sur place, abordant des sujets tels que la mise en œuvre de grands modèles, les super applications et la courbe future de la technologie, couvrant certaines questions clés allant de la recherche sur les grands modèles à la commercialisation.
Ce qui suit est une transcription de la conversation. Vous pouvez voir quelques profils de la manière dont les entreprises chinoises d’IA ont mis en œuvre de grands modèles.
De grands modèles sont mis en œuvre, ne vous concentrez pas uniquement sur les super applications
Q : En ce qui concerne le TPF (Technology-Problem Fit) pour les grands modèles, comment Zhipu combine-t-il la technologie avec les produits, puis les met-il en œuvre ? L'industrie n'est pas encore parvenue à un consensus à ce sujet.
Zhang Peng : Je n'ai jamais pensé que cette question doive être controversée. La mise en œuvre de toute nouvelle technologie nécessite un cycle. C'est une loi naturelle, mais ce cycle peut être long ou court, et lorsqu'une technologie révolutionnaire comme un grand modèle est mise en œuvre, Ce faisant, nous aurons certainement de plus grands défis et davantage de problèmes à résoudre.
D'un point de vue historique objectif, la mise en œuvre de cette révolution technologique a été assez rapide, mais précisément parce qu'elle est si rapide, la compréhension de chacun sur cette question est encore quelque peu inégale et la variance de la distribution est relativement grande.
La technologie doit encore être itérée et mise à jour rapidement, mais en termes d'application, nous ne pouvons pas attendre qu'elle soit pleinement mature avant de la mettre en œuvre .
Q : Pouvez-vous partager votre expérience dans la mise en œuvre de grands modèles ?
Zhang Peng : Tout d’abord, vous devez avoir une compréhension approfondie de la capacité à reconnaître ce modèle. Vous devriez essayer de saisir ses avantages et éviter de profiter de ses défauts. Par exemple, si vous demandez au modèle de calculer des modèles physiques ou des formules mathématiques très précises, c'est comme le cerveau humain. Il n'est pas bon dans ce domaine, alors vous. ne devrait pas le faire.
Par exemple, il n'est pas approprié de l'utiliser pour remplacer la calculatrice à laquelle vous êtes habitué, il faut donc trouver un angle approprié pour exploiter pleinement ses avantages, et ne pas aller dans la direction opposée, ni bloquer l'espace pour son chemin de développement, car les capacités du modèle peuvent être compromises à tout moment. Les itérations ont été écrasées .
Q : Jusqu’où sommes-nous des super applications d’IA dont tout le monde a parlé récemment ? En fait, il existe très peu d’applications d’IA comptant plus de 10 millions d’utilisateurs actifs quotidiens.
Zhang Peng : La définition que chacun a d'une super application est très vague. Chacun a ses propres idées. ChatGPT est-il considéré comme une super application ?
Q : Voyons à quelle analogie cela se compare.
Zhang Peng : Oui, il faut toujours avoir une analogie. ChatGPT est déjà le produit le plus rapide de l'histoire à compter plus de 100 millions d'utilisateurs mensuels. Si cela ne peut pas être appelé une super application, que peut-on appeler une super application ?
Ne regardez pas cette conclusion prématurément. Si vous observez le processus, vous constaterez qu'il s'est développé très rapidement, alors soyez patient. L'émergence de super applications n'est pas entièrement une question de technologie, mais prend également en compte de nombreux facteurs. comme le marché et si l'utilisateur est prêt .
Laissez-moi vous donner un autre exemple simple : le nombre d’utilisateurs du moteur de recherche Google est suffisamment important. Combien de temps a-t-il fallu pour qu’il passe du statut de moteur de recherche numéro un au monde à celui de trouver une voie commerciale réussie ? 6 ans. Cela a également pris 6 ans pour la Meta actuelle et le Facebook original.
Q : Il a également fallu plus de temps entre l’émergence de l’Internet mobile et WeChat et TikTok.
Zhang Peng : Alors pourquoi tout le monde ne peut-il pas attendre encore un peu ? Autant essayer. Tout comme lorsque nous jouions au jeu Arkanoid quand nous étions enfants, vous voulez viser l'écart et le frapper avec beaucoup de précision. Pour ce faire, vous devez d'abord trouver où se trouve l'écart ? Où est le chemin ?
Beaucoup de choses doivent être explorées les unes après les autres, et ce processus est très important. Ne vous contentez pas de voir les résultats finaux, mais plus important encore, nous agissons. Je pense que c'est à cela que tout le monde devrait prêter davantage attention en ce moment.
Q : Certaines personnes dans l'industrie pensent que des applications innovantes pourraient être mises en œuvre dans les prochaines années. Il a donné un délai très clair d'environ trois ans. Qu'en pensez-vous ?
Zhang Peng : Peut-être demain. Comme je viens de le dire, cette question nécessite une prise en compte approfondie de différents facteurs. Le premier est la maturité de la technologie elle-même, et le deuxième est de savoir si le marché et les utilisateurs eux-mêmes sont prêts. Le troisième est la découverte de la demande, et même un peu de chance s'ajoute. Il y a trop de variables, et il est difficile de prédire ce genre de chose avec un simple réseau neuronal comme mon cerveau.
Q : Il y a eu récemment une opinion très controversée selon laquelle un modèle de base sans application ne vaut rien.
Zhang Peng : Cette question elle-même est divisée en deux niveaux. Premièrement, l'innovation technologique est significative en soi, car nous avons de nombreux chercheurs scientifiques qui explorent constamment les causes de l'intelligence humaine. La façon dont les machines se rapprochent de l'intelligence humaine est d'une grande importance.
Le deuxième niveau. Si le résultat de cette exploration est que nous pouvons le concevoir et le produire, en le transformant en une force productive plus précieuse, cela aura une plus grande importance .
Cette question n’est pas un choix entre deux, mais une série de questions. L’application est bien sûr très importante. Nous espérons que la technologie pourra aujourd’hui se transformer en une plus grande productivité, mais cela ne signifie pas que notre poursuite de l’innovation technologique et de l’exploration essentielle est inutile. N’allez pas dans les deux extrêmes, ce sont des relations qui se renforcent mutuellement.
Q : Certains pensent également que le modèle open source n'est pas adapté à la plupart des scénarios d'application et que le modèle commercial fermé est le plus efficace. Il y a quelque temps, Zhipu a également publié la version open source de GLM-4. Que pensez-vous de la question des modèles open source et fermés ?
Zhang Peng : Nous avons toujours pensé que l'open source et le fermé avaient des objectifs et des significations essentielles différents. La source fermée est davantage considérée d’un point de vue commercial. Il s’agit d’une voie commerciale visant à fournir de meilleurs services et des produits plus sûrs. Quant à l’open source des grands modèles, son objectif est principalement d’enrichir l’écologie et de favoriser l’innovation technologique.
Si une technologie suit simplement une voie de développement fermée et monopolisée, elle manquera de vitalité ou deviendra un État qui n’est pas favorable à l’ensemble de l’écologie . Tout comme la biosphère, un certain degré de diversité doit être maintenu. L'open source consiste davantage à maintenir l'innovation technologique et la diversité technologique, afin que la communauté open source puisse également investir dans le cœur de la technologie.
Q : Vous avez déjà mentionné que la commercialisation de Zhipu se concentre sur le ToB. Sur quels secteurs les clients du ToB se concentrent-ils actuellement ? Pour quelles applications spécifiques aidez-vous les clients ?
Zhang Peng : Cela signifie simplement que notre principale source de revenus actuelle est toujours du côté du ToB, mais cela ne signifie pas que notre voie de commercialisation est uniquement le ToB.
À l'heure actuelle, les clients du côté B que nous servons couvrent plus de 10 secteurs, notamment la finance, l'éducation, Internet, la vente au détail, l'automobile, l'énergie, l'industrie manufacturière traditionnelle, etc.
Nous aidons actuellement les clients de l'industrie à se lancer, et j'utilise principalement plusieurs voies.
Tout d'abord, nous disposons de notre propre plate-forme ouverte, qui peut aider nos clients à accéder rapidement aux capacités des modèles à un coût relativement faible. Ils peuvent rapidement essayer des innovations, puis se mettre à jour et itérer leurs propres produits et l'autonomisation de l'IA.
La seconde s'adresse à certaines grandes entreprises qui ont des exigences relativement élevées en matière de sécurité des données et de privatisation. Nous fournirons des solutions de privatisation dans le cloud et des solutions de privatisation locales, puis nous serons spécifiques à certains scénarios, puis il y aura des solutions chinoises pour les petites entreprises. ainsi, nous fournirons des solutions logicielles et matérielles intégrées.
À l'heure actuelle, notre plateforme ouverte compte plus de 400 000 utilisateurs professionnels, dont quelques petites équipes de développeurs, qui ont enregistré et utilisé notre modèle d'API sur notre plateforme. Le volume de services quotidien dépasse désormais 60 milliards de jetons.
Q : OpenAI a récemment cessé de fournir des services API aux développeurs chinois et Zhipu a bientôt lancé un service de relocalisation. Quelle est la situation actuelle des utilisateurs qui migrent ici ?
Zhang Peng : D'après nos observations, il y a une augmentation, mais la réponse de l'ensemble du marché a un processus. J'ai également interrogé mes amis sur la situation. En fait, tout le monde a observé une augmentation.
Q : Avez-vous l’intention de partir à l’étranger la prochaine fois ?
Zhang Peng : Nous définissons déjà nos lignes d'activité internationales et négocions actuellement des contrats.
Quelle est la prochaine étape pour les grands modèles ?
Q : GPT-5 a été retardé. L'industrie estime que la courbe d'itération des grands modèles ralentit. La loi de mise à l'échelle touche-t-elle à sa fin ?
Zhang Peng : La première loi de mise à l'échelle était très simple et se concentrait uniquement sur les paramètres du modèle. Cependant, plus tard, tout le monde a découvert la connotation de la loi de mise à l'échelle. La taille de ses paramètres n'était qu'un des facteurs et variables. comme Nous avons parlé de la quantité de données utilisées pour la formation et du nombre de jetons, et avons découvert plus tard que cela était également lié à la quantité de calcul, de sorte que la connotation de la loi de mise à l'échelle elle-même change également constamment.
Ce qui est plus proche de la vérité de la loi de mise à l'échelle peut être la quantité de calcul. La quantité de calcul combine la puissance de calcul et les données, ainsi que l'échelle des paramètres, le résultat final peut être une variable complète, qui peut mieux représenter la loi de mise à l'échelle. Du point de vue du montant de calcul, nous pensons que la loi de mise à l'échelle est toujours efficace.
Un exemple secondaire pour le prouver est que les États-Unis limitent désormais l’exportation de la technologie de l’IA. Leur norme de restriction n’est plus, par exemple, la puissance de calcul de la puce ou la quantité de paramètres et de données du modèle, mais la quantité. de calcul. Tracez une ligne basée sur 10 à la puissance 24. Si le montant du calcul de ce modèle dépasse cette ligne, cela ne sera pas autorisé, vous pouvez donc voir qu'il se rapproche également de la vérité.
Mais quelle est son essence ? Nous sommes encore en exploration, car le Scaling Law lui-même est un phénomène observé et une règle obtenue. Ce n'est pas la connotation d'une vérité .
Q : À l'avenir, Zhipu AI préférera-t-il le grand modèle côté client ou sur le cloud ?
Zhang Peng : Nous pensons que la voie du grand modèle actuel est d'évoluer vers une intelligence artificielle générale, voire une super intelligence qui surpasse les humains. C'est une voie relativement fiable pour le moment, mais nous ne nous limiterons pas au cloud ou au client. côté choix .
Nous pensons que le développement de cette technologie comporte ses propres étapes, par exemple, à un certain stade, le cloud peut avoir le plus haut niveau d'intelligence en raison de la puissance de calcul et d'autres raisons si nous voulons passer à l'étape suivante de l'artificiel général. l’intelligence ou la super intelligence artificielle progresse. Il peut toujours être centralisé dans le cloud pour offrir cette capacité renforcée.
▲Robots humanoïdes sur WAIC.
Cependant, dans certains scénarios spécifiques, tels que les téléphones mobiles, les voitures et les robots intégrés aux appareils, il peut être nécessaire d'utiliser la puissance de calcul et les modèles d'extrémité pour coopérer avec le cloud. Cloud et côté final Avec ce modèle, nous pourrons peut-être atteindre à l'avenir une intelligence aussi intelligente que le cloud actuel sur les téléphones mobiles, mais cela implique de nombreux facteurs complets, tels que les puces, la puissance de calcul et l'énergie, ainsi qu'une série de facteurs. problèmes.
Toute technologie comporte des étapes. À ce stade, le plan est le suivant, mais à plus long terme, est-ce (côté appareil et cloud) la réponse ultime ? Certainement pas, cela va certainement se développer davantage à l’avenir.
Q : Selon vous, où se situera le prochain développement des grands modèles ?
Zhang Peng : À l'heure actuelle, les capacités linguistiques et écrites des grands modèles sont proches, voire légèrement supérieures, au niveau humain moyen. Ensuite, nous espérons utiliser un mot pour le décrire, « passer de la virtualité à la réalité », c'est-à-dire qu'il ne se limite plus à être un cerveau dans une cuve, mais qu'il peut entrer dans la vie et le travail réels pour créer une productivité réelle.
Pour atteindre cet objectif, en plus de la capacité linguistique, de nombreuses autres capacités sont nécessaires, telles que la capacité visuelle, la capacité auditive et la capacité d'utiliser les mains et les pieds pour faire grandir les mains et les pieds. Nous espérons que cela deviendra un état A multimodal. modèle de pointe capable de comprendre les intentions humaines, de décomposer les intentions humaines en étapes d'exécution logiques et d'utiliser des outils pour se connecter au monde physique afin d'accomplir ces tâches.
Puisque nous voulons qu’il ait une plus grande capacité à interférer avec le monde physique, la sécurité devient plus importante pour l’empêcher de faire des choses nuisibles dans le monde physique réel. C’est la même chose dans le monde numérique. Et nous devons le faire. plus avec l'alignement, nous appelons cela super intelligence et super alignement.
# Bienvenue pour suivre le compte public officiel WeChat d'Aifaner : Aifaner (ID WeChat : ifanr). Un contenu plus passionnant vous sera fourni dès que possible.
Ai Faner | Lien original · Voir les commentaires · Sina Weibo