Dernier discours de Jen-Hsun Huang : Chaque entreprise deviendra un fabricant d’IA
Lao Huang est à nouveau ici en tant que vendeur.
La semaine dernière, la valeur marchande de Nvidia a dépassé celle d'Apple et est devenue la plus importante au monde. En conséquence, le fondateur de Nvidia, Huang Jensen, est également resté inactif, entamant un voyage mondial et prononçant souvent des discours dans divers endroits.
La plus haute compétence en vente est de continuer à vendre, vendre et vendre.
Aujourd'hui, Huang Renxun s'est également rendu au Japon et a eu une réunion formelle avec le PDG du groupe SoftBank, Masayoshi Son.
Avant l'échange, Huang Renxun a d'abord prononcé un discours d'une heure, présentant aux participants ce qu'est l'IA et comment l'IA affectera nos vies. Lorsqu'il a rencontré un épisode, Huang a également suivi les Romains et a continué à parler. Marseille".
Lors de la communication avec Son Zhengyi, Huang Renxun a également montré beaucoup d'humour de « Huang ».
Par exemple, quand j'ai vu Masayoshi Son, j'ai commencé avec un pet arc-en-ciel qui a fait éclater de rire Son Masayoshi. Ou bien, en plaisantant en disant que Masayoshi Son était autrefois le plus grand actionnaire de Nvidia, il a également plaisanté sur ses regrets d'avoir raté l'acquisition de Nvidia.
- Huang Renxun a présenté que NVIDIA est une société de technologie de simulation qui se concentre sur la simulation de la physique, des mondes virtuels et de l'intelligence, aidant à prédire l'avenir grâce à la simulation, un peu comme la construction d'une machine à voyager dans le temps.
- Huang Renxun a souligné que l'objectif de Nvidia n'est pas de remplacer le CPU, mais d'améliorer les fonctions du CPU et de confier les tâches gourmandes en calcul au GPU.
- Passant de la programmation traditionnelle à l'apprentissage automatique, le logiciel 2.0 ne s'appuie plus sur le code traditionnel, mais fonctionne sur le GPU via des réseaux de neurones. Cette nouvelle façon de programmer rend l’informatique plus puissante, notamment dans les domaines de l’IA et du deep learning.
- À mesure que l’échelle des systèmes d’IA augmente, les capacités de raisonnement s’étendent également, ce qui signifie que l’IA est capable de réfléchir, de planifier et de réfléchir davantage, améliorant ainsi son intelligence et ses performances.
- NVIDIA continuera de promouvoir l'amélioration des performances informatiques, non seulement grâce au développement continu des GPU, mais également grâce à l'informatique collaborative afin de réduire les coûts et la consommation d'énergie.
- Huang Renxun et Masayoshi Son ont annoncé conjointement la construction d'un réseau d'IA au Japon, comprenant des usines et des réseaux d'IA, visant à fournir des services d'IA dans tout le Japon. Le Japon deviendra le premier pays au monde à atteindre cet objectif, et la technologie de l’IA entraînera des changements dans diverses industries au Japon.
Adresse vidéo originale pour les directions :https://www.nvidia.cn/events/ai-summit-japan/fireside-chat/
Vous trouverez ci-joint le texte intégral du discours de Huang Jen-Hsun et le texte intégral de la conversation au coin du feu. Le texte intégral totalise 17 000 mots et a été compilé par l'APPSO.
Pas seulement construire un GPU, mais plutôt construire une machine à voyager dans le temps
Jen-Hsun Huang : Bienvenue au NVIDIA AI Summit.
Chez NVIDIA, nous sommes avant tout une entreprise de technologie analogique.
Nous simulons la physique, nous simulons des mondes virtuels et nous simulons l'intelligence par la simulation. Nous vous aidons à prédire l'avenir. Ainsi, à bien des égards, Nvidia construit une machine à voyager dans le temps.
Aujourd’hui, nous partageons certaines de nos dernières avancées. Mais surtout, cet événement concerne l’écosystème japonais. Il y a tellement de partenaires ici, 350 startups, 250 000 développeurs, des centaines d'entreprises.
Nous avons déjà une coopération à long terme avec le Japon.
Le Japon a été très important pour nous depuis les débuts de l’entreprise. C'est au Japon que nous avons réalisé de nombreuses « premières ».
Par exemple, dans le domaine des jeux vidéo, Yu Suzuki de Sega a été le premier développeur de jeux avec lequel nous avons travaillé et il nous a aidé à porter les excellents jeux 3D de Sega sur les GPU NVIDIA.
C'était la première fois que quelqu'un utilisait la technologie CUDA de NVIDIA pour construire un supercalculateur. Le supercalculateur de l'Université des sciences et technologies de Tokyo utilisait le GPU de NVIDIA pour promouvoir le développement du calcul scientifique.
Le Japon est un pionnier mondial dans de nombreux domaines.
C'est également le Japon qui nous a permis de créer pour la première fois des processeurs mobiles, ce qui a conduit à l'un de nos projets très importants : la Nintendo Switch. Aujourd’hui, de nombreuses « premières » sont devenues réalité.
Nous nous trouvons désormais au point de départ de la révolution de l’IA, accueillant une toute nouvelle industrie et des changements technologiques étonnants. Cette période est passionnante mais aussi pleine de défis. C’est pourquoi nous sommes ici pour travailler avec des entreprises exceptionnelles de l’écosystème japonais pour amener l’IA au Japon et saisir cette opportunité sans précédent.
Nous avons de nombreux partenaires ici aujourd’hui et je tiens tout particulièrement à les remercier.
NVIDIA est le fondateur du calcul accéléré, et le calcul accéléré ne remplacera pas le processeur.
En fait, nous sommes presque la seule entreprise dans le domaine informatique qui n'a pas l'intention de remplacer le CPU, mais d'améliorer les capacités du CPU afin de décharger ces charges de travail intensives en calcul vers le GPU.
Ce sont les jeux d’instructions GPU qui fonctionnent avec le CPU.
De cette façon, nous pouvons profiter des avantages de deux processeurs : un CPU bon pour le traitement séquentiel et un GPU bon pour le traitement parallèle. J'y reviendrai plus en détail plus tard.
Mais il ne s’agit pas uniquement de calcul parallèle, mais de calcul accéléré, dans lequel le CPU et le GPU travaillent ensemble. Ce modèle informatique est nouveau dans le monde.
En fait, le modèle informatique basé uniquement sur le processeur existe depuis 1964, l'année après ma naissance, cela fait donc 60 ans.
La grande majorité des tâches informatiques dans le monde reposent aujourd’hui sur des processeurs.
Mais aujourd’hui, le modèle informatique subit un nouveau changement fondamental. Cependant, pour y parvenir, nous ne pouvons pas simplement porter le logiciel CPU à exécution séquentielle directement sur le GPU.
Pour réaliser le calcul parallèle, nous avons dû développer un tout nouvel ensemble d'algorithmes, et tout comme OpenGL a permis d'accélérer l'infographie par des processeurs graphiques, nous avons également dû développer de nombreuses bibliothèques spécifiques pour de nombreux domaines d'application différents.
Ces bibliothèques font partie des plus de 350 bibliothèques différentes dont dispose notre entreprise, dont certaines sont très importantes dans l'industrie. Par exemple, Kulit est une bibliothèque conçue pour la lithographie informatique qui peut accélérer considérablement le processus de lithographie. Lors de la fabrication d’un masque à puce, cela prend souvent des semaines en raison des nombreuses couches impliquées.
En utilisant cette technologie, nous avons réduit le temps de calcul de plusieurs semaines à quelques heures seulement.
Bien que nous puissions accélérer les cycles de fabrication des puces, cela permet surtout aux algorithmes de lithographie de devenir plus complexes et avancés, entraînant ainsi des progrès dans la physique des semi-conducteurs bien au-delà de 2 nm, 1 nm et de nœuds technologiques encore plus petits.
Par conséquent, la lithographie computationnelle sera accélérée grâce à cuLitho, Ku DSS (sparse solver) et à l’IA. Aujourd'hui, je vais détailler cette nouvelle bibliothèque passionnante qui permet à cet ordinateur d'exécuter la pile de protocoles radio 5G.
Fondamentalement, le système radio fonctionnant en temps réel s'appuie sur l'accélérateur CUDA pour la simulation quantique, la simulation de circuits quantiques, l'appariement dans le séquençage génétique, le CVS pour le stockage vectoriel ou la base de données vectorielles pour l'IA pour l'indexation et l'interrogation.
NumPy est la bibliothèque de traitement numérique la plus populaire au monde, utilisée par 5 millions de développeurs dans le monde. Au cours du seul mois dernier, il a été téléchargé 30 millions de fois, ce qui représente un nombre stupéfiant.
Désormais, il est entièrement accéléré et prend en charge les opérations multi-GPU et multi-nœuds. Si vous êtes intéressé, veuillez vérifier les informations pertinentes.
De plus, je vous présente un étonnant traitement de trames de données CDF, qui est utilisé pour le traitement de données structurées, telles que SQL, pandas, polaires, coopt et le problème classique du voyageur de commerce.
Ce problème a été accéléré, des centaines de fois plus rapidement, pour la physique de l’IA. Ensuite, nous avons créé une bibliothèque très importante appelée Coup DN Co DNA pour les réseaux de neurones profonds afin de gérer différents niveaux du système d'apprentissage profond.
En créant des QDM (Quantum Dots) et en accélérant le deep learning, nous avons réalisé quelque chose de très spécial et démocratisé le deep learning. Au cours de la dernière décennie, nous avons multiplié par un million l’ampleur de l’intelligence artificielle et de l’apprentissage automatique.
En augmentant d'un million de fois l'échelle de l'apprentissage automatique, nous avons réalisé une énorme avancée, et c'est cette avancée qui a donné naissance au ChatGPT d'aujourd'hui – l'arrivée de l'intelligence artificielle.
QDM a fait quelque chose de très spécial : il a changé la façon dont les logiciels étaient développés. C'était la situation avant le logiciel 1.0. Les programmeurs écrivaient du code pour décrire un algorithme, et l'algorithme était un logiciel.
Vous saisissez des données et le logiciel prédit la sortie. Le code écrit par des humains s'exécute généralement sur le processeur.
Le logiciel 1.0 consiste à écrire du code à exécuter sur le processeur. Nous sommes maintenant entrés dans l'ère du logiciel 2.0, car les ordinateurs sont déjà très rapides, vous pouvez leur fournir une grande quantité d'échantillons de données et les laisser apprendre et prédire les fonctions par eux-mêmes. Nous l'appelons Logiciel 2.0.
Par conséquent, il ne s'agit plus de programmation traditionnelle, mais d'apprentissage automatique ; il ne s'agit plus de code exécuté sur le CPU, mais de réseaux neuronaux exécutés sur GPU ISS. Les réseaux neuronaux sont le cœur du logiciel 2.0.
Ces réseaux de neurones fonctionnant sur GPU ISS ont formé un nouveau système d'exploitation et une nouvelle façon d'utiliser les ordinateurs. C'est le système d'exploitation des ordinateurs modernes – de grands modèles de langage.
Cette approche d’apprentissage automatique démontre son incroyable évolutivité et vous pouvez faire toutes sortes de choses avec. Bien entendu, cela inclut le texte numérisé, la langue, la voix, les images, les vidéos, etc. C'est multimodal, vous pouvez lui apprendre des séquences d'acides aminés, lui apprendre à comprendre presque tout, tout ce qui implique beaucoup de données d'observation.
La première étape consiste à comprendre la signification des données en étudiant de grandes quantités de textes sur Internet.
Grâce à cette approche, nous sommes capables de comprendre les mots, le vocabulaire, la grammaire et même le sens des mots en recherchant des modèles et des relations.
De nos jours, en utilisant la même méthode, nous pouvons non seulement comprendre la signification de différents types de données liées à différentes modalités, telles que la relation entre les mots et les images, le mot « chat » et l'image de « chat » sont connectés, apprenant après multimodalité, nous sommes même désormais capables de traduire et de générer.
Ainsi, nous pouvons comprendre toutes sortes de données, générer des informations intelligentes et créer diverses formes d’intelligence.
Si vous regardez toutes les startups et applications étonnantes créées aujourd’hui, vous verrez qu’elles se répartissent toutes dans l’une des deux combinaisons présentées sur cette diapositive :
Du texte au texte (comme le résumé, les questions et réponses, la génération de texte, la narration) ou du texte à d'autres formats (comme la vidéo au texte pour les sous-titres, l'image au texte pour la reconnaissance d'image, le texte à l'image pour la génération d'images, comme Midjourney , texte en vidéo pour la création vidéo, comme Runway ML).
Toutes ces différentes combinaisons sont révolutionnaires. Vous pouvez même passer de la protéine au texte pour expliquer la fonction de la protéine ; du texte aux substances chimiques, décrivant les propriétés chimiques qui peuvent devenir des médicaments efficaces ; vous pouvez même combiner la vidéo et le texte pour réaliser des performances de machine et de robotique ;
Chaque combinaison représente une nouvelle industrie, une nouvelle entreprise et un nouveau scénario d'application, déclenchant une choquante « explosion cambrienne » et générant un grand nombre de nouvelles applications.
Nous n’en sommes qu’au début. L’une des caractéristiques de l’apprentissage automatique est que plus le cerveau est grand, plus il peut apprendre de données et plus il devient intelligent.
Nous les appelons des lois de mise à l’échelle. Il existe désormais de nombreuses preuves qu'à mesure que l'échelle du modèle augmente et que la quantité de données de formation augmente, l'efficacité, la qualité et les performances du renseignement s'amélioreront.
Chaque année, l’industrie double environ la taille de ses modèles, ce qui nécessite un triplement correspondant de la quantité de données.
Par conséquent, nous avons besoin de quatre fois plus de ressources informatiques, et les ressources informatiques nécessaires pour faire passer l’intelligence artificielle au niveau supérieur sont énormes. Dans Scaling Laws, la pré-formation en fait partie, et la post-formation en fait également partie.
La post-formation s'effectue via diverses méthodes telles que l'apprentissage par renforcement, le feedback humain, l'apprentissage par renforcement et le feedback de l'IA. Il existe désormais de nombreuses façons d’utiliser la génération de données synthétiques dans la phase post-formation. Ainsi, la formation, la pré-formation et la post-formation connaissent une expansion significative et nous observons toujours de très bons résultats.
Lorsque Strawberry ou Open AI's o1 sont sortis, ils ont présenté au monde une toute nouvelle façon de raisonner.
L'inférence est le processus d'interaction avec l'IA, tout comme vous communiqueriez avec ChatGPT, mais ChatGPT est une chose ponctuelle. Vous lui posez une question, lui demandez de faire quelque chose, et quelle que soit la question que vous posez ou l'invite que vous donnez, il vous donne la réponse en une seule interaction.
Cependant, nous savons que réfléchir ne se résume souvent pas à un instant. Réfléchir nous oblige à essayer plusieurs fois et finalement à choisir la réponse la plus appropriée.
Tout comme lorsque nous réfléchissons, nous pouvons réfléchir à la réponse, puis donner la réponse. Il s'agit d'une réflexion ou nous pouvons décomposer un problème en une chaîne de réflexion étape par étape. Nous avons inventé de nombreuses techniques qui permettent à l'inférence de continuer à s'améliorer à mesure que nous investissons davantage de ressources informatiques.
Nous avons maintenant les deuxièmes lois d'échelle – les lois d'échelle de raisonnement, qui ne consistent pas seulement à générer le mot suivant, mais aussi à réfléchir, à réfléchir et à planifier. Ces deux expansions simultanées nous obligeront à pousser les performances informatiques à des vitesses vertigineuses chaque fois que nous proposerons une nouvelle génération et une nouvelle architecture.
Chaque fois que nous livrons, nous améliorons les performances de X fois tout en réduisant la consommation d'énergie et les coûts du même montant. Par conséquent, améliorer les performances équivaut à réduire les coûts, et améliorer les performances équivaut à réduire la consommation d’énergie.
Par conséquent, alors que le monde accepte et applique de plus en plus l’intelligence artificielle, notre mission est de promouvoir le développement de la technologie de l’intelligence artificielle et d’élargir son champ d’application.
Notre responsabilité est d'améliorer continuellement les performances et d'accélérer ce processus autant que possible, tout en élargissant les domaines d'application de l'intelligence artificielle, en améliorant son efficacité, en réduisant les coûts et en réduisant la consommation d'énergie. C'est pourquoi nous sommes passés à un cycle annuel.
Cependant, l’intelligence artificielle n’est pas qu’une question de puces. Ce système d'IA est énorme. C'est le système Blackwell.
Blackwell n'est pas seulement le nom d'un GPU, c'est le nom de tout un système, et le GPU lui-même est si bon qu'il doit être mentionné. Désolé, veuillez expliquer à tous les invités étrangers présents.
Donc, aujourd'hui, nous présentons Blackwell.
Chaque puce Blackwell est la plus grande au monde, avec 104 milliards de transistors, et est fabriquée par TSMC selon son procédé de pointe 4 nm. Les deux puces Blackwell sont interconnectées via une connexion basse consommation de 10 To par seconde.
Au cœur de la puce – ce fil conducteur – se trouvent des milliers de nœuds interconnectés, offrant des vitesses de transfert de 10 téraoctets par seconde.
Les puces sont connectées via huit modules de mémoire HBM 3e de SK hynix et Micron, avec une bande passante mémoire totale de 8 To par seconde. Les deux GPU sont connectés au CPU via NVLink et chaque GPU dispose d'une bande passante de connexion de 1,8 To par seconde.
Cela représente beaucoup de gigaoctets par seconde. Il en est ainsi parce que ce système ne fonctionne pas tout seul. Même les ordinateurs les plus avancés au monde ne peuvent pas accomplir seuls les tâches d’intelligence artificielle.
Parfois, il doit fonctionner avec des milliers d'ordinateurs comme celui-ci qui fonctionnent ensemble comme un seul ordinateur géant, et parfois ils doivent travailler de manière indépendante pour répondre à différents clients ou requêtes.
Par conséquent, ils fonctionnent parfois individuellement et parfois comme une unité, permettant au GPU de fonctionner comme une unité. Nous avons certes ce GPU connecté à des milliers d'autres GPU sur le réseau, mais nous avons toujours besoin de NVLink.
Ce NVLink nous permet de connecter plusieurs ISS GPU dans un rack, comme celui-ci derrière moi. Les racks sont connectés via NVLink avec une bande passante de 1,8 téraoctets par seconde, ce qui est 35 % plus rapide que le réseau à bande passante la plus élevée au monde. ce qui nous permet de connecter tous ces ISS GPU entre eux.
Il y a neuf commutateurs NVLink dans ce rack, avec 72 ordinateurs par rack connectés via le réseau.
NVLink est piloté directement via un fil de cuivre de 50 £, et avec ce superbe Cdes, nous l'appelons NVLink. Ils se connectent à l'ordinateur comme ceci via NVLink. Ce commutateur connecte tous ces ordinateurs en une seule entité.
Au final, 72 ordinateurs sont connectés entre eux pour former un super GPU, un énorme GPU. D'un point de vue logiciel, c'est une puce géante. Ces racks, ce rack coûte 3 000 £. Il est impossible de le déplacer à ce stade et de l'afficher.
Je vous le montrerais si je pouvais, 3 000 £, 120 kW. Cela équivaut à la puissance de très nombreuses Nintendo Switches. Ce n'est pas portable, mais c'est extrêmement puissant. Il s'agit du système Blackwall.
Nous l'avons conçu pour qu'il soit configuré comme un super nœud ou intégré dans un immense centre de données comportant des dizaines de milliers d'unités, idéalement des centaines de milliers d'unités. Ces machines sont connectées via des commutateurs, dont certains peuvent être intégrés de manière transparente à votre environnement Ethernet existant. Nous pouvons utiliser ces systèmes pour construire des supercalculateurs IA.
Nous pouvons les intégrer dans des centres de données d'entreprise, des centres de données hyperscale ou les configurer pour l'informatique de pointe. Non seulement les systèmes Blackwell sont incroyablement puissants, mais ils sont également extrêmement adaptables, s'intégrant facilement à tous les coins de l'infrastructure informatique du monde entier. Voici donc Blackwell, au-delà de Blackwell.
C'est un ordinateur, mais plus important encore, cet ordinateur ne fonctionne tout simplement pas sans tous les logiciels qui y sont exécutés.
C'est un choc quand on voit ces ordinateurs dotés de systèmes de refroidissement liquide et d'un câblage complexe. Comment peut-on programmer un ordinateur aussi puissant ? C’est à cela que sert la pile logicielle NVIDIA. Tous nos efforts incluent des travaux sur CUDA, le noyau Megatron, etc.
L'intégration de tous les logiciels que nous avons développés au fil des années, tels que TensorRT et Triton, permet à n'importe qui, partout dans le monde, de déployer des supercalculateurs d'IA.
Et puis, bien sûr, la couche logicielle IA simplifie encore davantage le processus de création de l’IA. Alors, qu’est-ce que l’IA exactement ? Nous parlons de l’IA sous de nombreux angles différents, mais il existe deux types d’IA qui, je pense, deviendront particulièrement populaires, et deux modèles mentaux qui m’ont été très utiles.
Les premières IA étaient essentiellement des travailleurs de l’IA numérique. Ces travailleurs de l’IA ont la capacité de comprendre, de planifier et d’exécuter.
Parfois, les travailleurs de l'IA numérique sont appelés à mener des campagnes de marketing, à assurer le support client, à élaborer des plans de chaîne d'approvisionnement, à optimiser la conception de puces, à aider à la programmation ou même à servir d'assistants de recherche ou d'assistants de laboratoire dans l'industrie de la découverte de médicaments.
Peut-être que ces agents peuvent servir de mentors personnels au PDG et peuvent également devenir des conseillers pour nos employés. Ces IA, ces travailleurs de l’IA numérique, nous les appelons des agents IA, en fait ils sont comme des employés du numérique.
Tout comme les collaborateurs du digital, il faut les former. Vous devez les accueillir dans l'entreprise en créant des données et en leur faisant connaître l'entreprise.
En fonction des fonctions spécifiques que vous souhaitez qu’ils accomplissent, vous leur fournirez une formation professionnelle appropriée et, une fois la formation terminée, vous devrez également les évaluer pour vous assurer qu’ils ont appris ce qu’ils devraient apprendre. Vous devez également mettre en place des mécanismes de protection pour garantir qu’ils ne font que ce pour quoi ils sont chargés et ne font pas des choses qu’ils ne sont pas censés faire.
Bien sûr, vous devez également faire fonctionner ces agents IA, les déployer et leur fournir de l'énergie et des jetons IA de Blackwell. Ils interagiront avec d'autres agents, travailleront ensemble et résoudront les problèmes. Vous verrez une variété d'agents différents. Pour permettre à l'écosystème de créer plus facilement des agents IA pour les entreprises, nous avons développé plusieurs outils.
NVIDIA n'est pas actif dans le secteur des services, ne crée ou ne fournit pas de produits finaux, ni ne fournit de solutions complètes. Notre mission est de fournir un support technique pour aider l'écosystème à créer, fournir et améliorer continuellement l'IA. Notre plateforme de cycle de vie des agents IA s'appelle Nemo.
Nemo fournit les bibliothèques dont vous avez besoin pour chaque étape que j'ai mentionnée plus tôt, de la gestion des données à la formation, en passant par le réglage fin, la génération de données synthétiques, l'évaluation et les mesures de protection. Toutes ces bibliothèques sont intégrées dans des workflows et des frameworks du monde entier.
Nous travaillons avec des startups d'IA et des fournisseurs de services comme Accenture et Deloitte pour diffuser cette technologie auprès des grandes entreprises du monde entier.
Nous travaillons également avec des éditeurs de logiciels tels que ServiceNow pour les aider à créer des agents IA qui utilisent ServiceNow.
Aujourd'hui, vous pouvez autoriser la plateforme ServiceNow à l'utiliser et obtenir l'aide de vos employés interagissant avec la plateforme ServiceNow. À l'avenir, ServiceNow fournira également un grand nombre d'agents IA, qui sont essentiellement des employés numériques que vous pourrez louer pour vous aider à résoudre des problèmes.
Nous coopérons avec des entreprises mondiales telles que SAP, Cadence, Ansyr, Snowflake, etc. pour créer conjointement des agents IA qui peuvent contribuer à améliorer la productivité de l'entreprise.
Désormais, ces agents peuvent comprendre, raisonner, planifier et agir, et ces agents sont en réalité un système composé de plusieurs modèles d’IA, et non d’un modèle unique. Nemo nous aide à construire ces agents.
Dans le même temps, nous avons également créé des modèles d'IA pré-entraînés et les avons regroupés dans ce qu'on appelle Nim (Nemo Inference), qui est un microservice.
Ces Nim sont donc comme des microservices, ce sont essentiellement des IA packagées. Dans le passé, les logiciels étaient emballés dans une boîte avec un CD, mais l'IA d'aujourd'hui est présentée sous forme de microservices et le logiciel lui-même est intelligent.
Vous pouvez avoir une conversation avec ce logiciel car il comprend ce que vous dites. De plus, vous pouvez connecter ces logiciels à d’autres logiciels.
Vous pouvez connecter cette IA avec d’autres IA pour former un agent IA. C’est le premier point. Permettez-moi de donner un exemple de l'application de ces agents IA.
L’IA transforme tous les secteurs, en utilisant un raisonnement sophistiqué et une planification itérative pour résoudre des problèmes complexes dans toutes les disciplines.
AI Agent peut accélérer le lancement d'activités marketing et fournir des informations instantanées ; aider à optimiser la chaîne d'approvisionnement et économiser des centaines de millions de dollars ; il peut également réduire le processus de traitement de la sécurité logicielle de quelques jours à quelques secondes en aidant les analystes à identifier rapidement les vulnérabilités ;
Ce qui rend l’IA si puissante, c’est sa capacité à transformer les données en connaissances, et les connaissances en actions.
Par exemple, cet agent numérique est capable d'éduquer les individus en extrayant des informations d'une série de documents de recherche riches en informations élaborés via NVIDIA AI Blueprints. NVIDIA AI Blueprint est un workflow de référence qui comprend des bibliothèques d'accélération NVIDIA, des SDK et des microservices Nim pour aider les utilisateurs à créer et déployer rapidement des applications d'IA.
Les plans d'extraction de données PDF multimodaux aident à créer des pipelines d'ingestion de données, tandis que les plans humains numériques fournissent des interactions fluides de type humain.
Le système AI Agent se compose de trois parties. Nemo, Nims et plans.
Ces ressources sont accessibles au public et vous pouvez les utiliser selon vos besoins pour créer votre propre équipe d'agents IA. Aucun Agent ne peut faire 100 % du travail de quelqu'un, aucun Agent ne peut faire cela.
Cependant, tous les agents seront capables de faire 50 % de votre travail, ce qui constitue une énorme réussite.
Plutôt que de penser que l’IA remplacera l’emploi de certains salariés, il vaut mieux penser que l’IA accomplit 50 % du travail de tous les salariés. Avec cette façon de penser, vous constaterez que l’IA contribuera à améliorer la productivité globale de l’entreprise, améliorant ainsi votre productivité personnelle.
Les gens me demandent souvent : l’IA va-t-elle prendre le relais de mon travail ? Je réponds toujours : l’IA en elle-même ne remplacera pas votre travail, elle ne remplacera votre travail que lorsque quelqu’un d’autre l’utilisera. Assurez-vous donc de commencer à utiliser l’IA le plus tôt possible. La première application est Digital AI Agent, ce sont des Agents numériques.
La deuxième application est l’IA physique. La technologie de base est la même, et ces technologies sont désormais incorporées dans des systèmes mécaniques. La robotique deviendra sans aucun doute l’une des industries les plus importantes au monde.
Jusqu’à présent, la robotique présentait de nombreuses limites. Et la raison de cette limitation est très claire. En fait, au Japon, 50 % des robots industriels mondiaux sont produits ici.
Kawasaki, Fanuc, Yaskawa et Mitsubishi sont les quatre entreprises leaders dans le domaine de la technologie robotique mondiale, produisant plus de la moitié des robots mondiaux.
Bien que les robots aient joué un rôle important dans l’amélioration de la productivité manufacturière, l’industrie robotique s’est développée lentement sur une longue période. La raison en est que la technologie robotique est trop limitée, manque de flexibilité et ne peut pas s’adapter aux différents scénarios, conditions et besoins de travail.
Nous avons besoin d’une IA plus flexible, capable de s’adapter et d’apprendre de manière autonome.
Vous remarquerez que la technologie que nous avons décrite jusqu'à présent – l'IA basée sur les agents – devrait être capable d'interagir avec ces agents et d'obtenir une réponse de n'importe qui.
Bien sûr, ces réponses ne sont parfois pas aussi bonnes que celles que nous générerions nous-mêmes, mais en fait, dans de nombreux cas, elles sont encore meilleures que nous.
Par conséquent, nous pouvons appliquer cette technologie générale de l’IA au domaine de l’IA incarnée ou de l’IA physique, que nous appelons habituellement la robotique. Pour mettre en œuvre la robotique, nous devons construire trois ordinateurs.
Le premier ordinateur est utilisé pour entraîner l'IA, comme tous les exemples que nous avons mentionnés précédemment ; le deuxième ordinateur est utilisé pour simuler l'IA, et vous devez fournir un environnement de formation pour que l'IA puisse apprendre et tirer des connaissances à partir de données synthétiques. Nous l'appelons Omniverse.
Omniverse est une bibliothèque d'IA physique jumelle numérique de monde virtuel que nous avons créée pour l'IA physique et la robotique. Après formation, validation et évaluation, vous pouvez porter le modèle formé sur un robot physique.
Dans la foulée, nous disposons d’un processeur conçu spécifiquement pour les robots appelé Jetson Thor.
Thor est un processeur robotique conçu pour les robots humanoïdes. Ce processus continuera à se dérouler. Tout comme la plateforme de cycle de vie Nemo AI Agent, la plateforme Omniverse peut également vous aider à créer de l'IA. En fin de compte, l'IA que vous attendez verra un monde sur le côté gauche de l'écran qui reconnaît la vidéo, l'environnement et vos besoins, et génère les actions correspondantes.
Tout comme nous pouvons traiter du texte et générer des vidéos, nous pouvons également traiter du texte et générer des compositions chimiques pharmaceutiques. Nous pouvons traiter du texte et générer des mouvements corporels. Ce concept est très similaire à l'IA générative, c'est pourquoi nous pensons que maintenant que nous disposons des bases techniques nécessaires – de l'Omnivers à tous les systèmes informatiques que nous construisons jusqu'à la dernière technologie d'IA générative – le moment est venu pour l'intelligence artificielle. la robotique est devenue une réalité.
Alors, pourquoi les robots humanoïdes sont-ils si difficiles à fabriquer ? De toute évidence, en tant qu’humains, nous sommes incroyablement complexes et développer des logiciels pour les robots humanoïdes est encore plus difficile.
Toutefois, les récompenses sont énormes. À l’heure actuelle, il n’existe que deux types d’ordinateurs dans le monde qui peuvent être facilement déployés dans le monde entier. Le premier concerne les systèmes robotiques de type automobile, en grande partie parce que nous avons construit un monde auquel les voitures peuvent s’adapter.
Le deuxième type est celui des robots humanoïdes. Les deux systèmes robotiques peuvent être déployés n’importe où dans le monde car nous avons créé ce monde pour nous-mêmes. Même si ces deux technologies sont incroyablement complexes, leur époque est mûre et leur impact sera énorme.
La semaine dernière, lors de la Robot Learning Conference, nous avons annoncé un nouveau framework très important appelé Isaac Lab.
Isaac Lab est un système de simulation virtuelle d'apprentissage par renforcement qui enseigne aux robots humanoïdes comment devenir des robots humanoïdes. Nous avons développé plusieurs workflows sur cette base. Le premier workflow s'appelle Groot Mimic. Groot Mimic est un framework qui permet aux robots d'apprendre à accomplir des tâches grâce à une démonstration humaine.
En utilisant des techniques de randomisation de domaine, nous pouvons générer un grand nombre d’autres instances de démonstrations similaires pour aider le robot à apprendre à généraliser. Sans ce processus, il ne peut accomplir que des tâches très spécifiques. Grâce à Mimic, nous pouvons permettre aux robots d’acquérir un plus large éventail de compétences.
Le deuxième processus est Groot Gen Groen. Grâce à la technologie d'IA générative, sur la plateforme Omniverse, nous pouvons créer un grand nombre d'instances d'environnement dans des champs aléatoires et concevoir diverses actions que nous souhaitons que le robot effectue.
Nous développons donc une série de tests, de systèmes d’évaluation et de scénarios d’évaluation qui permettent aux robots de s’essayer et de s’améliorer, en apprenant à devenir de meilleurs robots.
Le troisième élément est le contrôle de groupe. Le contrôle par essaim est un cadre de distillation de modèles qui nous permet de condenser toutes les tâches et compétences acquises dans un modèle unifié permettant aux robots d'exécuter des compétences cinématiques.
Le point que je viens d’évoquer est également plus important : non seulement les robots deviendront autonomes, mais les usines du futur seront également robotisées. Ces usines seront pilotées par des robots, coordonnant des robots et construisant des systèmes mécaniques qui sont eux-mêmes des robots.
Quelle période incroyable.
Nous avons donc deux systèmes robotiques, l'un est numérique, nous l'appelons AI Agent. Vous pouvez utiliser ces agents au bureau pour collaborer avec les employés. Le deuxième type concerne les systèmes d’IA physiques, à savoir la robotique. Ces systèmes physiques d’IA deviendront les produits que les entreprises construiront.
Les entreprises utiliseront donc l’IA pour rendre leurs employés plus productifs, et nous utiliserons l’IA pour piloter et améliorer les produits que nous vendons. Le constructeur automobile du futur disposera de deux usines : l’une pour produire des voitures et l’autre pour produire l’IA embarquée. C'est le début de la révolution robotique.
Il y a beaucoup d’activités dans le monde et je ne peux pas imaginer un pays mieux placé que le Japon pour mener la révolution de l’IA robotique.
La raison est simple, comme vous le savez tous, vous aimez les robots et avez créé les meilleurs robots du monde. Ces robots nous ont accompagnés dans notre croissance et sont devenus nos êtres préférés tout au long de notre vie. En fait, j'ai encore beaucoup de robots préférés que je n'ai pas montrés, comme Mazinger Z, Gundam, etc. Il y en a tout simplement trop, mais je n'ai pas oublié de mentionner le robot incontrôlable, désolé.
J’espère donc que le Japon pourra exploiter les dernières avancées en matière d’IA et les combiner avec votre expertise en mécatronique.
Aucun pays au monde n'a plus d'avantages que le Japon en matière de mécatronique. Il est vital pour vous de saisir cette opportunité extraordinaire. J'espère que nous pourrons travailler ensemble pour réaliser ce rêve. NVIDIA AI a connu un grand succès au Japon et nous avons de nombreux partenaires. Nous avons des partenaires qui construisent de grands modèles linguistiques, tels que l'Institut des sciences et technologies de Tokyo, Rakuten, etc.
L’IA est utilisée dans de nombreux domaines différents, notamment dans l’industrie de la découverte de médicaments, où l’IA est utilisée de diverses manières.
Je suis donc très enthousiasmé par les progrès réalisés ici et nous espérons accélérer notre développement et saisir les opportunités de la révolution de l'IA.
L'industrie est en train de changer. Comme je l'ai déjà dit, l'industrie informatique est passée de l'ère du codage basé sur le processeur à l'ère actuelle de l'apprentissage automatique basé sur le GPU. L'industrie de l'intelligence artificielle passe d'une pure industrie de fabrication de logiciels à une industrie axée sur la fabrication d'intelligence artificielle.
L’IA est produite dans des usines qui fonctionnent 24h/24 et 7j/7. Lorsque vous achetez un logiciel et que vous l'installez sur votre ordinateur, la fabrication et la distribution du logiciel sont terminées.
Cependant, l'intelligence n'est jamais terminée. Vous continuez à interagir avec tous les systèmes d'IA, qu'il s'agisse d'un agent IA ou d'un robot IA. L'intelligence est exprimée sous forme de jeton, et le jeton est l'unité d'intelligence, qui est un nombre.
Ces nombres sont organisés ensemble de différentes manières pour former l'intelligence : par exemple, l'intelligence dans le langage, l'intelligence dans les volants, l'intelligence dans les voitures autonomes, l'intelligence dans les moteurs contrôlant les robots humanoïdes, l'intelligence dans la découverte de médicaments, etc.
Tous ces jetons sont produits dans ces usines. Ces infrastructures et usines n’ont jamais existé auparavant et représentent des industries entièrement nouvelles, c’est pourquoi nous assistons pour la première fois à tant d’avancées technologiques dans le monde.
Nous inaugurons une nouvelle industrie – la naissance d’une nouvelle usine, que nous appelons fabrication d’intelligence artificielle.
Ces usines seront construites par diverses entreprises, et chaque entreprise deviendra un fabricant d’IA. De toute évidence, aucune entreprise ne peut se permettre de ne pas produire d’intelligence artificielle. Comment une entreprise peut-elle se permettre un avenir sans intelligence ? Comment un pays peut-il se permettre un avenir sans intelligence ?
Vous n’êtes pas obligé de produire des puces, vous n’êtes pas obligé de produire des logiciels, mais vous devez produire de l’intelligence. L'intelligence est vitale, elle est au cœur de votre identité et elle est au cœur de notre identité.
Nous avons donc une nouvelle industrie : les usines d’IA. C'est ce que j'appelle la nouvelle révolution industrielle.
La dernière fois qu'un tel changement s'est produit, c'était il y a 300 ans, lorsque l'électricité a été découverte et généralisée, sa production et sa distribution et de nouveaux types d'usines ont été créés. Cette nouvelle centrale n’était pas une centrale électrique, mais faisait partie de l’industrie énergétique, prenant place dans le contexte de la révolution industrielle. Et maintenant, nous avons une toute nouvelle industrie qui n’a jamais été vue auparavant.
L’intelligence artificielle n’est pas seulement un produit de l’industrie informatique, elle est également appliquée et créée dans tous les horizons.
Vous devez créer votre propre IA. L’industrie pharmaceutique doit créer sa propre IA, l’industrie automobile doit créer sa propre IA et l’industrie robotique doit également créer sa propre IA. Chaque industrie, chaque entreprise et chaque pays doit avoir sa propre IA. Il s’agit d’une nouvelle révolution industrielle.
J'ai une annonce importante aujourd'hui : nous coopérerons avec SoftBank pour construire une infrastructure d'IA au Japon. Nous construirons conjointement la plus grande usine d'IA du Japon : NVIDIA AI Factory.
L'usine sera basée sur la plate-forme NVIDIA DGX et devrait être achevée au début de l'année prochaine.
Lorsque l’usine sera terminée, elle disposera de 25 exaflops de puissance de calcul. Gardez à l’esprit que le plus grand supercalculateur du monde a récemment atteint 1 Exaflop, et que cette usine aura une capacité de 25 Exaflops et est spécialement conçue pour produire de l’IA.
Mais afin de distribuer l'IA, SoftBank intégrera NVIDIA ISS Aerial, qui est le moteur radio 5G que j'ai mentionné précédemment, basé sur l'architecture CUDA. De cette manière, nous pouvons intégrer de manière unifiée les capacités informatiques radio, informatiques, en bande de base et IA des réseaux 5G.
Nous pouvons désormais évoluer et réarchitecturer les réseaux télécoms pour les transformer en AI RAN (Radio Access Network). Il peut non seulement transmettre de la voix, des données et de la vidéo, mais aussi l’IA, un nouveau type d’intelligence informationnelle.
Ce réseau desservira 55 millions d'utilisateurs à travers les 200 000 sites de SoftBank. Les usines d’IA fabriqueront de l’IA et les réseaux de distribution d’IA distribueront l’IA.
Nous construirons également un nouveau magasin basé sur cette infrastructure – les produits AI Store AI créés par SoftBank et des tiers seront fournis à 55 millions d'utilisateurs via cette plateforme. Nous allons créer ces applications sur la plateforme NVIDIA AI Enterprise et lancer une nouvelle boutique pour rendre l'IA accessible à tous.
Il s’agira d’un développement énorme qui permettra à terme de former un réseau d’IA à travers le Japon. Ce réseau d’IA fera partie de l’infrastructure.
Et n’oubliez pas que l’une des infrastructures les plus importantes est que vous avez besoin d’usines et de routes dans le cadre de votre infrastructure pour pouvoir fabriquer et distribuer des marchandises. Vous avez également besoin d’énergie et de communications dans le cadre de l’infrastructure.
Chaque fois que vous apportez des innovations fondamentales en matière d’infrastructure, de nouvelles industries, de nouvelles entreprises, de nouvelles opportunités économiques et une nouvelle prospérité naissent. Comment aurions-nous pu vivre la révolution industrielle sans routes et sans usines ? Sans énergie et sans communications, comment pouvons-nous amorcer la révolution des technologies de l’information ?
Chaque nouvelle infrastructure nous apporte de nouvelles opportunités. Donc, pour moi, c'est vraiment excitant de travailler avec SoftBank pour que cela se réalise au Japon. C'est une révolution complète. C'est la première fois qu'un réseau de télécommunications se transforme en réseau d'intelligence artificielle.
D'accord, laissez-moi vous montrer ce que vous pouvez faire. Prenons cet exemple.
Je me tiens sous une tour de téléphonie cellulaire, à côté d'une tour de radio, et j'ai une vidéo dans la voiture qui est diffusée via la tour de téléphonie cellulaire. Cette station de base est équipée de l'IA. Cette tour radio est équipée d'une intelligence vidéo qui voit tout ce que la voiture voit et comprend ce qu'elle voit.
Ce modèle d'IA est peut-être trop gros pour être installé dans une voiture, mais il peut certainement être placé dans une station de base. Grâce à la vidéo reçue par la station de base, elle peut comprendre tout ce qui se passe dans la voiture et dans son environnement.
D'accord, ce n'est donc qu'un exemple d'utilisation de l'IA de pointe pour la sécurité. En d’autres termes, il s’agit essentiellement d’un contrôle du trafic aérien pour les voitures autonomes, et ses applications sont illimitées. Nous pouvons également utiliser cette idée de base pour transformer des usines entières en IA.
Écoutez, c'est une usine. Maintenant, où suis-je ? D'accord, je suis perdu, il y a beaucoup de caméras ici et la vidéo est diffusée vers la station de base. Étonnamment, avec ces caméras et ces modèles d’IA, cette usine est désormais devenue une IA.
Vous pouvez parler à l’usine et demander ce qui se passe à l’usine. Demandez à l'usine : des accidents se sont-ils produits aujourd'hui ? Y a-t-il des anomalies ? Quelqu'un est-il blessé aujourd'hui ? Toutes ces informations vous seront fournies sous forme de rapports quotidiens, il vous suffit de demander à l'usine, car désormais l'usine est devenue une IA.
Ce modèle d'IA n'a pas besoin de fonctionner dans une usine ; il peut également fonctionner sur les systèmes radio de SoftBank. Eh bien, voici un autre exemple. En fait, vous pouvez transformer presque n'importe quel objet physique en IA : stades, routes, usines, entrepôts, bureaux, bâtiments.
Ils peuvent tous devenir IA. Il vous suffit de communiquer avec eux comme vous le feriez avec ChatGPT. Alors, que se passe-t-il dans les allées de l’entrepôt ? Y a-t-il des obstructions ou des déversements ? Vous parlez juste à l'usine.
L’usine a observé et compris toutes les situations, elle peut raisonner et planifier des actions, ou simplement vous parler. Il pourrait répondre : "Non, il n'y a pas d'obstructions, de déversements ou de dangers dans les allées de l'entrepôt. Les conditions des allées dans la vidéo semblent organisées, propres et exemptes de toute obstruction ou danger."
OK, maintenant tu parles à l'usine, ce qui est incroyable. Vous parlez à l'entrepôt, vous parlez à la voiture, car ceux-ci sont désormais intelligents.
Regret de la disparition de Nvidia, Huang Renxun et Son Zhengyi partagent la même douleur
Jen-Hsun Huang : Eh bien, il y a aussi un invité très spécial aujourd'hui qui parle également de la manière d'introduire l'intelligence artificielle au Japon. Vous connaissez peut-être cet ami. Le grand Masa (Son Masayoshi), ici pour vous dire quelque chose.
Je ne sais pas si vous le savez, mais je travaille dans l'industrie technologique depuis de nombreuses années. L’industrie informatique est passée du PC à Internet, puis au cloud computing, puis à l’Internet mobile, au cloud computing et enfin à l’intelligence artificielle.
Masa est le seul entrepreneur, le seul innovateur qui sélectionne et s'associe aux bons gagnants à chaque génération.
Rappelez-vous, c'est Masa qui a amené Bill Gates au Japon, c'est Masa qui a amené Jerry Yang au Japon, c'est Masa qui a donné naissance à l'industrie chinoise du cloud computing, c'est Masa qui a aidé Alibaba à décoller, c'est Masa qui a amené Steve Jobs. et l'iPhone au Japon.
Beaucoup d'entre vous ne savent peut-être pas que Masa était autrefois le principal actionnaire de Nvidia. Oh, ça n'a pas d'importance.
Comment as-tu fait ? Comment distinguez-vous les innovateurs de chaque révolution technologique de l’histoire de l’informatique ?
Fils : Eh bien, je pense que j'ai juste eu de la chance. Je suis né à la bonne époque et j’ai rencontré de grands entrepreneurs comme vous.
C’est une passion, un rêve et un instinct, et vous pouvez sentir qui sont les vrais pionniers, qui sont les vrais innovateurs. Je sens vraiment que j'ai beaucoup de chance. Mais c'est aussi la même vision, on se sent, non ?
Comme des loups qui se sentent mutuellement. J'ai l'impression que nous pouvons nous sentir comme des loups.
Jen-Hsun Huang : J'ai deux chiots. Je n'aime pas cette métaphore maintenant. En regardant l’histoire, comme vous l’avez dit, en quoi cette transition, ce changement de plateforme et cette révolution sont-ils différents des révolutions précédentes ? Pensez-vous qu'il y a une différence ?
Masayoshi Son : Eh bien, je pense que c'est la frontière la plus excitante et la plus dynamique du futur. C’est 100 fois, mille fois plus grand que tout ce qui a précédé. C'est la plus grosse vague, je vous le dis.
Jensen Huang : Oui, je pense que mathématiquement ou du point de vue de l'industrie, il est important de réaliser que même si l'IA est un logiciel, c'est un type de logiciel très différent. L’industrie du logiciel que vous et moi avons créée ensemble est une industrie d’outils, des outils à usage humain.
Et ce nouveau type de logiciels, les réseaux de neurones, les grands modèles de langage, les agents intelligents et les robots, ne sont pas des outils, ce sont des compétences, ce sont des tâches. Ils peuvent faire des choses, ils peuvent effectuer un travail, et le marché de « l’industrie du travail » ne représente pas 1 000 milliards de dollars, mais 100 000 milliards de dollars.
Jen-Hsun Huang : Nous réalisons que cette industrie n'est pas seulement une transformation du secteur informatique, mais une transformation de tous les secteurs, et c'est pourquoi elle est si importante.
Masayoshi Son : Oui, les humains sont les seuls animaux dotés d'un super cerveau par rapport aux autres espèces. C’est précisément grâce à la puissance du cerveau que les humains sont si puissants. Si vous regardez simplement les muscles, comme ceux des lions et des éléphants, leurs muscles sont plus forts, mais les humains ont le cerveau le plus intelligent.
Aujourd’hui, toutes les activités du PIB mondial reposent sur l’activité du cerveau humain. Je pense que toutes les industries seront touchées par cette révolution.
Jensen Huang : Vous avez raison, et l'une des choses les plus surprenantes est que dans une industrie dominée par les atomes, il y a une limite à sa taille. Comme il n’y a qu’un nombre limité d’atomes, vous disposez d’un nombre limité d’atomes que vous pouvez déplacer et ils sont lourds.
Mais l’industrie de l’IA est constituée d’électrons, oui, elle est régie par la mécanique quantique, et son échelle est infinie.
Masayoshi Son : Oui, la valeur de l'intelligence est bien supérieure au pur mouvement matériel. En pensant à ce genre de chaîne de réflexion et de processus de raisonnement, c’est vraiment incroyable et étonnant.
Jen-Hsun Huang : Oui, l’une des choses importantes que nous avons annoncées aujourd’hui est la construction conjointe du réseau japonais d’IA.
Cette grille d'IA comprendra des usines d'IA pour développer des modèles d'IA, ainsi que des réseaux d'IA pouvant distribuer ces modèles d'IA dans tout le Japon. L'architecture de l'usine d'IA et le réseau d'IA que nous avons conçus conjointement sont révolutionnaires et il n'existe aucun modèle similaire dans le monde.
Le Japon deviendra le premier pays au monde à atteindre cet objectif.
Masayoshi Son : Oui, d'autres sociétés de télécommunications doivent suivre cette nouvelle tendance.
Jen-Hsun Huang : Ensuite, j'ai quelques questions à vous poser. Tout d’abord, comment SoftBank applique-t-elle ce système à elle-même et à vos filiales ? Comment pensez-vous que ce réseau d’IA va révolutionner l’industrie japonaise de l’IA ?
Masayoshi Son : Comme vous venez de le mentionner, nos stations de base n'étaient utilisées que pour transmettre des données telles que les télécommunications et Internet. Cependant, désormais, grâce au soutien de ce réseau intelligent, nous serons étroitement connectés les uns aux autres et ferons partie de l'infrastructure intelligente du Japon. Ce sera très étonnant.
Jensen Huang : Bien sûr, vous pouvez également l'appliquer à vos filiales, comme j'ai mentionné Yahoo Japan et PayPay, oui. Ainsi, vous pouvez créer des systèmes d’IA pour rendre tous vos services plus intéressants et utiles, améliorant ainsi l’expérience du consommateur.
Mais ce qui me passionne le plus, c’est de mettre cette ressource à la disposition des chercheurs, des étudiants et des startups pour qu’ils se développent au Japon.
Masayoshi Son : En effet, grâce à votre soutien, nous créons le plus grand centre de données d'IA au Japon. Miyagawa et moi discutons de la nécessité d'ouvrir cette plateforme à de nombreux chercheurs, étudiants et startups pour encourager leur développement.
Nous travaillons également sur des subventions pour leur permettre d'avoir un meilleur accès à ces ressources informatiques.
Jen-Hsun Huang : La construction d'infrastructures nécessite beaucoup d'investissements en capital. Oui, vous réalisez un investissement majeur au Japon. Vous savez, nous en avons déjà discuté à plusieurs reprises : à bien des égards, le Japon était à la pointe de l'innovation technologique à l'ère de la mécatronique, lorsque la technologie mécanique et la technologie électronique ont commencé à fusionner.
En fait, même à cette époque, le Japon était le leader mondial de l’électronique grand public. Cependant, lorsque l’industrie informatique et les logiciels ont commencé à se développer, je pense que l’industrie du logiciel en Occident et en Chine a connu un essor au cours des trente dernières années, et que le Japon aurait pu être plus actif.
Masayoshi Son : À cette époque, et encore aujourd'hui, de nombreuses grandes entreprises et médias se considéraient comme des « adultes ». Ils disaient autrefois « fabriquer des produits physiques », ce qui signifie que seule la fabrication d'objets physiques a une valeur et un sens réels, tandis que les logiciels sont simplement virtuels. difficile de faire confiance.
Cette vision de la valeur des logiciels existe au Japon depuis de nombreuses années. Cela a également provoqué chez les jeunes entrepreneurs, surtout après l'éclatement de la bulle Internet, un sentiment de frustration et de dépression. Les jeunes ont été durement touchés par les voix des critiques.
Je pense que nous devons raviver cette passion grâce à la robotique, comme vous l'avez dit, en intégrant l'intelligence artificielle à la robotique.
Le Japon a des personnages de dessins animés comme "Astro Boy", et mon préféré est le robot de Tesla. On ne peut pas seulement avoir des muscles, le robot doit avoir de l'intelligence pour pouvoir parler, avoir des émotions et être amis.
Je pense que cette poussée en faveur d’une technologie de pointe et de nos défis est absolument nécessaire au Japon à l’heure actuelle.
Jensen Huang : Oui, je pense que l'ère du logiciel est désormais arrivée. La bonne nouvelle est que cela marque le début d’une nouvelle ère.
Fils : Oui, réinitialisez une fois, réinitialisez à nouveau, appuyez sur le bouton de réinitialisation.
Jensen Huang : Oui, l'industrie est en train d'être réinitialisée. Vous pouvez constater que l’ensemble de la pile technologique est en train d’être remanié parce que les entreprises de la génération précédente ne se portent pas bien dans cette nouvelle ère. C’est vrai, une toute nouvelle pile technologique a émergé, offrant des opportunités sans précédent.
Le Japon doit saisir cette opportunité et profiter de cette période. Et l’intelligence artificielle est complètement différente des logiciels. L’intelligence artificielle nécessite que vous ayez une expertise en matière de données et de domaine. Oui, si vous êtes un artiste, vous possédez une expertise dans le domaine. Si vous développez des jeux vidéo, vous possédez également une expertise du domaine.
Jen-Hsun Huang : Si vous êtes engagé dans la recherche sur les médicaments et inventez de nouveaux médicaments, vous possédez également une expertise dans le domaine. Si vous possédez une expertise dans un domaine, vous pouvez utiliser des données pour décrire cette expertise. Ces données peuvent être utilisées pour former un modèle d'IA, et ce modèle d'IA devient votre intelligence artificielle.
Fils : Absolument. C’est donc une toute nouvelle opportunité. Heureusement, le Japon n’a pas supprimé cette révolution de l’IA. Certains autres pays tentent de surprotéger leur technologie, de sorte que leurs systèmes réglementaires deviennent quelque peu confus.
Au Japon, nous avons au moins de la chance que le gouvernement ne semble pas mettre d’obstacles à cette révolution. Néanmoins, je pense que le gouvernement devrait encourager le développement de l’IA et encourager davantage d’innovation. Comme vous l’avez dit, c’est le moment de la réinitialisation de l’industrie, le meilleur moment pour embrasser une nouvelle révolution.
Masayoshi Son : Nous ne devons pas manquer ce moment ou cette opportunité.
Jensen Huang : Bien sûr, pour faire partie de la révolution de l'IA, il faut une infrastructure et ce type de logiciel car il s'agit d'apprentissage automatique. Vous aurez besoin de beaucoup de ressources. Merci, merci. Et vous avez besoin d’infrastructures.
Sans infrastructure, il est impossible de mettre pleinement en œuvre l’intelligence artificielle. C'est pourquoi SoftBank construit un réseau d'IA au Japon. Oui, vous catalyserez, activerez et accélérerez toute l’activité qui est déjà là.
Fils : Nous le montrons à travers nos démonstrations.
Jen-Hsun Huang : Oui, j'espère qu'aujourd'hui nous avons coopéré avec 350 start-up au Japon. Oui, 350 startups sur 22 000 dans le monde. Oui, ce ratio n'est pas raisonnable. Nous devons donc encourager les jeunes entrepreneurs et innovateurs à s’essayer avec audace et à investir dans le domaine de l’IA. L'infrastructure est déjà en place.
Masayoshi Son : Comme Miya Kawa et moi en avons discuté, nous allons créer le plus grand centre de données d'IA au Japon. Nous allons donc proposer de nombreux programmes d’incitation pour subventionner la puissance de calcul afin qu’ils puissent l’utiliser presque gratuitement, essayer de nouveaux modèles et tester leurs applications presque gratuitement.
Les applications d’IA devraient également être soutenues par certains dons, n’est-ce pas ?
Jen-Hsun Huang : Eh bien, finalement, c'est la dernière fois que j'invite Masa. Chaque fois que je vois Masa, je dois dépenser de l'argent.
Masayoshi Son : C'est bon pour tout le monde.
Jensen Huang : Ouais, c'est génial d'entendre ça. Masa, quels aspects de l’IA au Japon attendez-vous le plus avec impatience à l’avenir ? Qu'attendez-vous ? Quel est ton rêve ?
Masayoshi Son : Eh bien, comme vous l'avez dit, je suis très passionné par l'IA et la robotique.
Je pense que les solutions médicales d’IA, en particulier l’AGI médicale, arrivent certainement. Je constate également l'émergence de nombreux nouveaux agents IA. Par exemple, nous avons LINE, Yahoo et d'autres services qui peuvent également personnaliser de nombreux agents IA spécialisés pour aider les modes de vie japonais.
Ceux-ci peuvent être fournis par nos soins. Vous savez, nous comprenons la culture, le comportement, les renseignements locaux et les API japonais, et de nombreux sites Web au Japon utilisent ces technologies. Je pense donc qu'agents d'IA d'entreprise, je suis très favorable à cette direction que vous avez mentionnée et j'en suis très enthousiasmé.
Mais je pense aussi que les agents IA personnels apparaîtront véritablement dans la vie de chacun. Bill Gates a dit un jour : « Il y a un PC sur chaque ordinateur de bureau », et Steve Jobs a déclaré : « Tout le monde a un smartphone à la main ».
Je pense que nous devrions dire maintenant : « Chacun devrait avoir son propre agent IA. » Ainsi, à l’avenir, chacun disposera de son propre assistant IA personnel. Oui, cela nous aidera à planifier nos voyages, nos vacances et même nos études.
Jen-Hsun Huang : Il vous accompagnera tout au long de votre vie. Oui, pouvez-vous imaginer qu'un agent IA connaisse toute votre vie ?
Masayoshi Son : Absolument, nos petits-enfants et petites-filles grandiront avec des iPhone dès l'âge d'un an. Chaque fois qu'ils voient une photo, ils mettent le doigt dessus, même s'il s'agit d'une image fixe. Parce qu’ils ont appris à utiliser deux doigts dès leur plus jeune âge.
À l’avenir, penseront-ils : peut-être que chaque image pourra être agrandie ?
Jensen Huang : Quand ils voient la photo, ils lui parlent, n'est-ce pas ? Ils poussent et poussent, en espérant qu'il réponde.
Masayoshi Son : Vous pouvez imaginer qu'ils ont leur propre assistant personnel d'IA dès l'âge d'un an, comme un deuxième ami, qui les accompagne pour grandir et tout comprendre. L'assistant IA sait quand ils sont malades, ce qu'il y a chez eux ou s'il s'agit de leur tuteur personnel.
Jen-Hsun Huang : Oui, dès le plus jeune âge, tout à fait raison. Il se souvient de tout ce que vous avez lu, de tout ce qu'il vous a appris et ressemble exactement à votre Aristote personnel.
Masayoshi Son : Absolument, complètement un jumeau numérique. Je pense que cela arrive vraiment. En combinant les connaissances locales, la culture, etc. japonaises, ainsi que la commercialisation localisée des agents, notre avenir sera immense et incroyable.
Jensen Huang : Oui, vous savez, la plupart des pays réalisent désormais que les données des citoyens du pays contiennent en réalité les connaissances, la culture et la sagesse du pays, et que ces données devraient appartenir au pays, tout comme la sécurité du pays.
Chaque pays devrait donc traiter ses propres données et les transformer en intelligence artificielle au service de sa propre population. Il n’y a absolument aucune raison de sous-traiter cette tâche à d’autres.
Fils : C'est très, très important. Chaque pays souverain et chaque gouvernement doit migrer les données de sécurité nationale vers son propre centre de données d'IA. Cela deviendra quelque chose que chaque pays devra posséder. Chaque pays doit assurer la sécurité de ses propres données.
Je crois qu'à l'avenir, chaque pays élaborera des lois et des réglementations pertinentes pour garantir que chaque pays puisse générer sa propre sagesse.
Jen-Hsun Huang : Bien entendu, chaque entreprise créera également sa propre sagesse et sa propre intelligence artificielle. Oui, comment une entreprise peut-elle ne pas créer sa propre intelligence artificielle ?
Masayoshi Son : Oui, les entreprises donnent leur « cerveau » aux autres.
Jensen Huang : C'est vrai, c'est vrai. Je pense donc que le monde commence à se réveiller. La première étape la plus importante consiste à disposer d’un réseau national d’IA. Comment peut-on avoir une industrie automobile sans infrastructure ?
Fils : Totalement, complètement, vous savez.
Jensen Huang : Vous avez donc construit des « routes » de l'IA pour le Japon, et sur ces routes, toutes sortes de nouveaux services et de nouvelles entreprises fleuriront. Je suis vraiment très excité. Eh bien, Masa, pouvez-vous imaginer si vous étiez le plus grand actionnaire de Nvidia aujourd'hui ?
Fils : Haha, c'est vrai. Nous avons eu trois opportunités de devenir le premier actionnaire de Nvidia.
Jen-Hsun Huang : Je me souviens que c'était deux fois.
Masayoshi Son : Non, non, non, la première fois que nous sommes devenus actionnaires via un achat sur le marché, nous avons discuté, euh, même parlé de choses que nous ne voulions pas mentionner. Arrêter de parler. Il y a dix ans, si je savais que je le regretterais maintenant, je le ferais certainement…
Jen-Hsun Huang : C'est bon. Laissez-moi vous dire ce que Masa a dit. Masa a dit : Jensen, le marché ne comprend pas la valeur de Nvidia. Votre avenir est incroyable, mais le marché ne peut pas le comprendre.
C’était il y a dix ans, et votre chemin de douleur continuera parce que vous créez l’avenir. Alors laissez-moi vous donner de l'argent pour acheter Nvidia. Un jour, il a voulu me prêter de l’argent pour acheter Nvidia.
Maintenant, je regrette de ne pas avoir accepté cette offre. Quelle belle idée. OK, la meilleure idée du monde.
Jen-Hsun Huang : Oui, c'est l'idée dont nous venons de parler. C'était un mois après que je l'ai acquise. Oui, puis nous avons discuté de la fusion des deux sociétés. Oui, un autre, un autre rêve secret.
Masayoshi Son : C'était notre idée originale. La première fois, nous avons parlé de devenir privé, puis la deuxième fois, j'ai simplement acheté sur le marché, et la troisième fois, c'était… oh, eh bien, trois tentatives.
Jensen Huang : Mais désormais, nous allons créer ensemble une valeur incroyable. Oui, Nvidia et SoftBank collaboreront. Le marché est incroyable.
Fils Zhengyi : Hahahahahaha, très bien.
Jen-Hsun Huang : Je suis donc très heureuse que nous fassions quelque chose d'aussi significatif. Oui, j'ai beaucoup d'espoir quant à l'avenir du Japon.
Fils : Eh bien, ce n'est que le début, nous ferons beaucoup de choses ensemble. Merci, l'industrie est très vaste, il existe de nombreux domaines mobiles, IoT et automobiles, et vous disposez d'excellents centres de données, jeux et autres domaines, nous pouvons avoir de nombreuses opportunités de coopération.
Jen-Hsun Huang : J'attends tout cela avec impatience. Oui, mesdames et messieurs, le soleil brille. Masayoshi Son, eh bien, je pense qu'il est sans aucun doute l'un des plus grands entrepreneurs du monde.
Merci M. Masa. Vous pouvez voir sa passion pour l’intelligence artificielle, et les partenariats sur lesquels nous travaillons amèneront les réseaux d’IA au Japon, des usines aux réseaux d’IA distribués. Avant de partir, j'aimerais souhaiter la bienvenue à tout le monde au AI Summit. Il y a beaucoup de grandes conférences et beaucoup de partenaires ici.
Notre objectif, notre mission est de travailler avec tout le monde pour amener l'IA au Japon, activer l'IA ici et utiliser cette opportunité de réinitialisation technologique pour conduire la transformation de l'entreprise et construire la prochaine grande entreprise.
Le Japon a toujours été particulièrement proche de moi. La plupart des gens ne savent probablement pas que sans le Japon, et je le dis très sérieusement, sans le Japon, NVIDIA ne serait peut-être pas là aujourd'hui. Et il y a une raison.
Sans le Japon, nous n’aurions pas vu naître le premier supercalculateur d’IA. Le Japon a donc toujours été très important pour moi. Je suis très reconnaissant pour notre partenariat et très reconnaissant pour votre amitié.
# Bienvenue pour suivre le compte public officiel WeChat d'aifaner : aifaner (ID WeChat : ifanr). Un contenu plus passionnant vous sera fourni dès que possible.
Ai Faner | Lien original · Voir les commentaires · Sina Weibo