Pourquoi Tesla et Ideal ne veulent-ils pas admettre qu’ils sont des « constructeurs automobiles » ?

Le grand réalisateur James Cameron a été scénariste en 2019 et a produit un film "Alita : Battle Angel". La bande dessinée originale "Guangdong" de ce film date de 1991. En 2000, il existait un cadre très avancé : les habitants vivant dans la « Casse » au fond du monde étaient pour la plupart des personnes modifiées dotées de cerveaux humains et de corps mécaniques, tandis que les habitants vivant dans la ville utopique « Zalem » au sommet de le monde "Les habitants ont eu leur cerveau retiré à l'âge adulte, implanté avec des cerveaux de puces, contrôlés par des superordinateurs, mais transformés en corps humains.

Outre les descriptions de combat et de science-fiction, "Gunsheng" soulevait une question qui semblait mystérieuse à l'époque : laquelle est une personne réelle, une personne avec un cerveau humain et un corps mécanique, ou une personne avec un cerveau mécanique et un corps humain ? corps?

Toutes les entreprises devraient-elles être des entreprises d’IA ? Toutes les entreprises peuvent être des sociétés de renseignement incarnées !

Après que ChatGPT 3.5 et la technologie des grands modèles ont commencé à être connus du public au cours du second semestre 2023, certaines personnes ont également crié un slogan : toutes les entreprises devraient être des entreprises d'IA. Les entreprises qui ne se lancent pas dans l'IA et ne peuvent pas l'utiliser n'auront aucune compétitivité dans le domaine. avenir.

Nous avons donc vécu d’innombrables nuits de bouleversements humains au cours du premier semestre 2024. Toute nouvelle nouvelle d’OpenAI, Microsoft, Google ou Nvidia peut être interprétée comme un tournant dans l’histoire.

Ensuite, les gens ont découvert que l’impact de l’IA sur le monde ne semblait pas aussi grave que le prétendaient les médias.

Parallèlement aux progrès rapides de l'IA, on assiste également à la montée du concept d'« intelligence incarnée », qui est également un concept ayant des significations philosophiques, biologiques, de science-fiction et technologiques.

Nous pouvons comprendre « l'intelligence incarnée » de cette manière simple : l'intelligence incarnée consiste à donner un corps à l'intelligence et à combiner le système intelligent avec le corps du robot afin qu'il puisse reconnaître l'environnement, comprendre l'environnement, interagir et agir avec l'environnement pour incarner intelligence.

En Chine, qui possède une industrie manufacturière développée, « l’intelligence incarnée » est en fait un concept plus attrayant que l’IA et plus facilement accepté par le public. Il s’agit également d’une voie technologique de l’IA plus adaptée aux industries chinoises.

La raison pour laquelle je ressens cela est qu'après la seconde moitié de 2024, lorsque l'industrie est devenue plus calme, dans de nombreuses interviews que j'ai réalisées, j'ai mentionné que l'orientation future du développement de mon entreprise sera ou inclura l'intelligence incarnée.

Ce qui est intéressant, c'est que ces entreprises ne sont pas des entreprises de robotique ou d'intelligence artificielle au sens strict du terme dans la perception du public, mais des constructeurs automobiles, des constructeurs de drones ou des entreprises d'électroménager aux yeux du public…

En août de l'année dernière, Ai Faner a eu une conversation avec l'équipe Ideal Intelligent Driving. Lang Xianpeng, vice-président de la R&D d'Ideal Intelligent Driving, a décrit la conduite intelligente de l'itinéraire technique de bout en bout comme étant différente de la conduite intelligente précédente. qui reposait sur la logique « perception-planification-contrôle ». La différence entre « capacité et fonction ».

En d’autres termes, apprenez à un homme à pêcher ou apprenez-lui à pêcher.

▲ Le cadre modèle sous-jacent de bout en bout + VLM pourrait être le cadre universel actuel pour l'intelligence incorporée

Lors d'entretiens, l'équipe principale de Li Auto comparera Li Auto à un robot sur roues, et parlera également de l'application prototype de porteurs intelligents incarnés tels que des robots humanoïdes utilisant le cadre « de bout en bout + VLM ».

En étudiant les technologies de conduite intelligente pour les dépassements dans les virages, les constructeurs automobiles ont découvert l’aube de l’intelligence incarnée.

Puis Li Xiang, le fondateur d'Ideal, est apparu dans une interview exclusive à la fin de l'année dernière, exprimant directement le positionnement et la vision d'Ideal : Ideal est une société d'intelligence artificielle, engagée dans l'automation de l'intelligence artificielle et promouvant l'inclusivité de l'intelligence artificielle. à chaque famille.

Si vous avez prêté attention à l'événement de la Journée de la technologie de l'IA de Xiaopeng 2024, vous constaterez également que Xiaopeng tient haut la bannière de l'IA, et a également lancé le robot IA Iron et placé les personnes stratégiques des machines IA dans une position importante, en disant que sans 50 milliards, il ne peut pas le faire.

Sans oublier que Musk a souligné à plusieurs reprises que "Tesla est une entreprise d'IA et de robotique, pas seulement un constructeur automobile". En ce qui concerne la construction et la vente de voitures, tout le monde a dû sentir que Musk a perdu tout intérêt et a plus d'énergie pour les modèles commerciaux. xAI, TeslaBot et RoboTaxi+FSD.

▲Figure 02

Même OpenAI, qui est considérée comme la société d’IA la plus orthodoxe et la plus pure, peut également être une société d’intelligence personnelle. Les investisseurs derrière la société de robots IA Figure comprennent des sociétés géantes telles que OpenAI, Microsoft et Nvidia. La figure 02, publiée au cours du second semestre de l'année dernière, est qualifiée de « matériel d'IA le plus avancé de la planète » et sa technologie d'IA comprend. capacités d'IA multimodales, fournies par OpenAI.

Il est très cohérent que qu'il s'agisse du TeslaBot de Tesla, du Iron de Xpeng ou de la Figure 02, ils sont tous disposés à travailler dans l'atelier de production automobile. Bien qu'il y ait une composante marketing, cela illustre également leur vision.

Dans de nombreuses subdivisions, comme XAG, qui se concentre sur le domaine agricole, on pense que l'intelligence incarnée peut également être utilisée dans la phase de production agricole de l'agriculture et de la récolte. Par exemple, les grands champs de coton et les champs de céréales disposent de grandes machines de récolte, mais. lors de la récolte des pommes, dans les scénarios de vergers comme la récolte des poires, il est difficile pour les grosses machines agricoles d'entrer, et la cueillette se fait principalement manuellement. Les robots IA capables de manœuvrer sur des terrains complexes et étroits et les bras robotisés conviennent parfaitement à ce scénario. .

Cloud Whale, dont les principaux produits actuels sont des robots de balayage et de nettoyage et des autolaveuses, estime que le nettoyage actuel de l'environnement domestique ne couvre que les surfaces planes, c'est-à-dire le nettoyage du sol. À l'avenir, l'orientation du développement de Cloud Whale est le nettoyage de l'espace, c'est-à-dire le nettoyage de l'espace. c'est-à-dire le nettoyage de divers ordinateurs de bureau et comptoirs et la finition. Si vous souhaitez nettoyer l'espace, vous aurez naturellement besoin de capacités d'intelligence artificielle avec des « capacités visuelles » comme noyau, ainsi que de structures mécaniques plus dimensionnelles évoluées sur la base de robots de balayage et de nettoyage.

▲Robot de balayage Soror Saros Z70 avec manipulateur

Par coïncidence, lors du salon phare du CES 2025, les deux fabricants de robots de balayage Roborock et Zhuimi ont lancé des robots de balayage dotés de mains de robot, ou technologie de main de robot bionique multi-articulée. Les robots de balayage ne sont que des porteurs de la technologie des mains de robot.

▲ La main du robot de Dyson fait une démonstration de tâches ménagères

Plus tôt, Dyson a également publié du matériel de démonstration pour que les robots nettoient les maisons. Fondamentalement, les principaux fabricants engagés dans le nettoyage domestique ont commencé à réfléchir à l'utilisation du matériel des bras robotiques et des capacités de l'IA avec la vision de l'IA comme noyau pour briser les seules limites du nettoyage. le sol est l'intelligence incarnée dans l'environnement domestique.

Bien que la phrase « toutes les entreprises peuvent être des sociétés de renseignement incarné » dans le sous-titre fasse un peu la une des journaux, l'importance de cette insistance est que ce groupe d'entreprises qui s'intéressent à l'intelligence incarnée n'est pas complètement loin de la commercialisation, les sociétés de robotique. qui sont très proches de la technologie de pointe (comme Boston Robotics) et sont probablement des entreprises avec lesquelles nous sommes en contact quotidiennement. Elles ont des modèles commerciaux et des flux de trésorerie matures, ainsi qu'une énorme détermination à investir dans la technologie.

C’est aussi l’un des signes que la voie technique peut continuer : le consensus.

De nombreuses tendances technologiques populaires, telles que AR/VR/XR, Metaverse, NFT, etc., peuvent être très populaires, mais le consensus est fragile. Chacun a ses propres idées et calculs. Il n'y a pas de synergie et pas de scénario universel.

▲Alita n'a même pas de crâne et utilise une structure mécanique pour envelopper son cerveau. L'image est tirée d'une image de "Alita : Battle Angel".

Donner l'intelligence au corps, ou le corps à l'intelligence ?

"Donner du temps à la civilisation, pas du temps à la civilisation" est une phrase universelle, tout comme lorsque nous discutons de l'intelligence incarnée, nous devons également discuter de l'opportunité de "donner l'intelligence au corps, ou de donner le corps à l'intelligence ?"

Nous pouvons également revenir à la question initiale, « Un rêve d'armes », « Laquelle est une personne réelle, une personne avec un cerveau humain et un corps mécanique, ou une personne avec un cerveau mécanique et un corps humain ? »

Yao Qizhi, lauréat du prix Turing, académicien de l'Académie chinoise des sciences, doyen de l'Institut d'information croisée de l'Université Tsinghua et fondateur du meilleur berceau de talents informatiques au monde « Tsinghua Yao Class », a pris la parole lors du World Robot 2023. Conférence et dit :

Les êtres humains eux-mêmes sont une intelligence incarnée idéale dans le monde.

Il comporte essentiellement trois aspects, trois composantes : le premier aspect est le corps, le deuxième aspect est le cervelet et le troisième aspect est le cerveau.

Certaines parties du corps doivent disposer d'un matériel suffisant, avec des capteurs et des actionneurs. Le cervelet dominera diverses perceptions visuelles et tactiles pour contrôler le corps et accomplir des tâches complexes. Enfin, la partie cérébrale dominera le raisonnement logique, la prise de décision et la prise de décision de niveau supérieur. le traitement à long terme. La planification du temps peut communiquer avec d’autres agents et l’environnement en utilisant le langage naturel.

La triple métaphore du corps, du cervelet et du cerveau est l’explication la plus compréhensible de l’industrie de « l’intelligence incarnée ».

Par rapport à la relative maturité du corps, la maturité du « cervelet » et du « cerveau » en intelligence incarnée est loin d'être suffisante, notamment le « cerveau ».

En tant que module responsable de la « perception-raisonnement-prédiction-action », il existe encore un énorme écart entre les capacités cérébrales de l'intelligence incarnée et celles des humains, et la recherche en est également à ses débuts. Google a publié le système de contrôle du robot SayCan en 2022. et l'année suivante, un grand modèle multimodal PaLM-E avec des paramètres 562B a été développé, y compris un modèle visuel avec des paramètres 22B.

▲ Introduction à PaLM-E

L'avancée de PaLM-E réside dans le fait que le robot intelligent incarné peut décomposer de manière autonome des tâches, prendre des mesures et effectuer des tâches basées sur des instructions en langage naturel humain, de la même manière que ChatGPT génère des résultats basés sur des invites.

En outre, des organisations telles que Google et DeepMind ont également rassemblé des ensembles de données de formation pour les robots. Le dernier RT-X rassemble des données provenant de 22 types de robots différents, couvrant 1 million de clips, démontrant plus de 500 compétences robotiques et 160 000 performances de tâches.

Li Feifei, professeur titulaire à Stanford et ancien scientifique en chef chez Google, a récemment réorienté ses recherches vers l'intelligence spatiale et a fondé la société de technologie d'intelligence spatiale World Labs, dans le but de mettre à niveau le modèle d'IA d'un plan de pixels 2D à un plan complet. Monde 3D (monde virtuel et réel), créez des modèles de grand monde (LWM) pour percevoir, générer et interagir avec le monde 3D.

Avant de fonder World Labs, Li Feifei a également apporté des contributions significatives dans le domaine de l'intelligence incarnée. Le VoxPoser qu'elle a dirigé est similaire à PaLM-E. Il s'agit également d'un grand modèle multimodal d'intelligence incarnée, doté d'une forte intelligence visuelle et de la capacité de le faire. transformer les instructions en langage naturel en capacité à entreprendre des actions spécifiques.

▲ Le robot alimenté par VoxPoser contourne le vase et ouvre le tiroir

Par exemple, si vous dites au robot « Ouvre le tiroir, fais attention au vase », le robot contournera le vase pour ouvrir le tiroir.

Entre cette commande en langage naturel et l'action finale, cela montre que le robot soutenu par VoxPoser peut savoir ce qu'est un tiroir, ce qu'est un vase, et peut voir la position du tiroir et du vase dans l'espace 3D. "soyez prudent" et quelle est la tâche finale… ….

▲ Logique d'exécution de VoxPoser

Cela signifie que le robot a des oreilles, des yeux, un cerveau et bien sûr des mains. Le cerveau comprendra les instructions entendues par les oreilles, puis les décomposera en étapes de tâche. Ensuite, le cerveau dirigera les yeux pour générer une « carte » d'informations spatiales, et enfin les mains agiront selon la « carte ».

Dans un processus aussi complexe, le grand modèle de langage et le modèle visuel du grand modèle multimodal interagiront en permanence pour générer des informations telles que du code pour les tâches de démantèlement, des cartes d'informations spatiales et des codes pour l'exécution des tâches.

Plus important encore, le robot n'a pas suivi de pré-formation, mais a directement accompli la tâche. C'est la plus grande différence entre l'intelligence incarnée et les robots précédents : les robots précédents, qu'il s'agisse de bras robotiques sur la chaîne de production ou de robots dansants lors de la fête. tous fonctionnent selon des procédures fixes, n’ont qu’un seul ensemble de modèles comportementaux et sont incapables de comprendre et de répondre aux informations environnementales.

L'intelligence incorporée soutenue par de grands modèles multimodaux produira également des capacités « émergentes ». Par exemple, s'il n'y a pas de pré-formation, il est demandé au robot de retirer la moitié du tiroir, car il ne connaît pas la longueur du tiroir. tiroir à l'avance, donc "la moitié" Ce que c'est, car le robot est inconnu.

Mais voici comment le robot résout le problème : commencez par retirer complètement le tiroir, puis repoussez-le à moitié, ce qui équivaut à retirer la moitié du tiroir.

En d’autres termes, les grands modèles multimodaux comme VoxPoser donnent à l’intelligence incarnée la capacité de « généraliser », c’est-à-dire que l’intelligence incarnée peut non seulement faire une chose, mais aussi tirer des conclusions et faire plusieurs choses.

Cela nous ramène à la question évoquée plus haut : faut-il apprendre aux gens à pêcher ou apprendre aux gens à pêcher ? Les grands modèles de bout en bout sont comme « apprendre aux gens à pêcher » en conduite intelligente, et rédiger des réglementations, c'est « apprendre aux gens à pêcher ». De même, lorsque les grands modèles multimodaux génèrent eux-mêmes du code, ils maîtrisent le " capacité", et les capacités peuvent générer diverses "fonctions".

La démonstration de VoxPoser peut nous aider à comprendre la différence significative entre l'intelligence incarnée et les différents robots précédents, et peut également répondre à la question du sous-titre : Donner de l'intelligence au corps, ou donner le corps à l'intelligence ?

Bien entendu, l’intelligence reçoit un corps, et le cerveau est le maître du corps.

La question de « Gun Meng » a également reçu une réponse. Laquelle est une personne réelle, une personne avec un cerveau humain et un corps mécanique, ou une personne avec un cerveau mécanique et un corps humain ? Bien sûr, c'est le premier.

▲ Tesla a développé sa propre puce Dojo et son système Dojo pour la formation en IA

Puissance et intelligence, Musk et MAGA

Les questions philosophiques et techniques peuvent être lointaines et obscures, mais les questions pratiques existeront toujours.

Quand je réfléchis aux raisons pour lesquelles les constructeurs automobiles actuels sont si friands de l’IA et de l’intelligence incarnée qu’ils doivent abandonner leur identité de « constructeur automobile », certaines réflexions me viennent à l’esprit :

  • La production automobile est la plus grande activité de production industrielle et recherche toujours la technologie la plus avancée, la plus grande efficacité et la moindre dépendance à l’égard de la fabrication humaine.
  • La poursuite d’une conduite automobile intelligente ne repose pas non plus sur les humains.
  • Autrefois, les voitures étaient des produits dotés de la puissance la plus élevée que les gens ordinaires pouvaient conduire, mais ce sont désormais des produits dotés de la puissance de calcul (intelligence) la plus élevée que les gens ordinaires puissent posséder.

L'usine Tesla de Shanghai est l'une des usines les plus automatisées et les plus efficaces de l'industrie automobile. Bien entendu, elle peut aussi être l'une des usines automobiles avec le moins d'implication humaine.

▲Ligne de production automobile contemporaine

Le concept d'« usine à lumière noire » est également très populaire dans l'industrie automobile. De nombreux constructeurs automobiles promeuvent également spécifiquement « l'usine à lumière noire ». La soi-disant « usine à lumière noire » signifie qu'il n'y a pas besoin de participation humaine ni de participation humaine. haut degré d'automatisation et d'intelligence. Une ligne de production ou une usine qui peut fonctionner sans éclairage.

En tant que gens ordinaires, nous comprenons que « l'abandon » des humains par les voitures est davantage une question de conduite intelligente. Il est prévisible que le « comportement de conduite » deviendra de plus en plus rare à l'avenir, s'éloignant de plus en plus de la vie quotidienne et s'éloignant de plus en plus. et plus loin des loisirs proches.

Nous pouvons également comprendre les voitures comme un produit sous un autre angle. Qu'il s'agisse d'un produit de Tesla ou de Wei Xiaoli, elle peut être considérée comme le produit doté de la plus grande puissance et de la plus grande intelligence que les gens ordinaires puissent posséder.

Pendant longtemps, la puissance et l'intelligence ont été séparées. Les voitures à l'ère des véhicules à carburant avaient une intelligence limitée. Bien qu'il y ait de nombreuses puces dans la voiture, le processus de fabrication et la puissance de calcul étaient très arriérés. Les téléphones portables et les ordinateurs que nous utilisons quotidiennement. ainsi que le cloud computing derrière eux, ont une bonne puissance de calcul, mais ils n'ont pas de puissance.

Désormais, une voiture électrique phare peut avoir des milliers de chevaux et des dizaines de milliards de transistors.

Si vous y réfléchissez sous cet angle, les marques automobiles qui ajoutent des capteurs aux voitures pour augmenter la puissance de calcul des puces, construisent leurs propres pôles de formation Wanka pour fabriquer de grands modèles, et les marques automobiles qui insistent pour embaucher d'anciens immortels du dessin au trait pour dessiner. les tours de taille sur leurs voitures sont déjà complètement différents Différentes catégories.

Il est alors trop raisonnable pour la première de se qualifier d’« entreprise d’intelligence artificielle et de robotique ».

Récemment, Musk et certains partisans fanatiques de Trump (appelés groupe MAGA) ont eu une confrontation acharnée sur les réseaux sociaux. La raison en était que le groupe MAGA s'opposait aux visas de travail pour les talents hautement qualifiés, estimant que de tels visas supprimeraient des emplois. des talents locaux, laissant d'excellentes opportunités d'emploi aux étrangers.

Musk, un immigré né en Afrique du Sud, et son autre allié immigré ont réfuté très directement, même avec leurs propres effets de brise-défense et de pulvérisation :

  • Les talents techniques et d'ingénierie introduits par des voies légales telles que les visas de travail pour talents hautement qualifiés sont très importants, tout comme les Nuggets de la NBA ont présenté l'athlète serbe Jokic.
  • La culture amérindienne favorise les stars du parti plutôt que les talents scientifiques, et l’inverse est vrai ailleurs.
  • Il faudrait introduire davantage de talents en haute technologie, de préférence doublés.

Il existe également des preuves de complots similaires. Par exemple, certains médias ont déclaré que si les investisseurs américains voyaient une équipe entrepreneuriale Internet de la Silicon Valley sans noms chinois, ils poseraient une question :

Il n’y a pas de Chinois dans votre équipe, alors qui fera le travail ?

Comme le dit le proverbe, les mensonges ne font jamais de mal, la vérité est l'arme la plus tranchante. Le sous-texte de Musk et de ses alliés est que le groupe MAGA ne peut pas faire le travail des talents de haute technologie, et que le travail est réservé aux personnes intelligentes.

C’est l’une des vérités, et la deuxième vérité est que les emplois de col bleu de niveau intermédiaire concentrés dans le groupe MAGA sont exactement ce que Musk avait prévu.

▲ Les robots travaillant dans les usines sont une astuce marketing et un scénario inévitable dans le futur.

Dans les domaines de l'industrie manufacturière, de la logistique, de la construction, de l'entreposage, de l'agroalimentaire et autres, un grand nombre de postes peu qualifiés et très répétitifs constituent actuellement les principales opportunités d'emploi du groupe MAGA. Ces postes ont été occupés par de nombreuses lignes de production automatisées. les autres sont plus flexibles. Il est également probable qu’ils soient remplacés par des robots intelligents incarnés dotés d’une meilleure compréhension de l’environnement et de capacités d’apprentissage.

Alors, qui étudie principalement ces intelligences incarnées ? Talents d'ingénierie et techniques introduits grâce au visa de talent de haute technologie.

Lorsque le fondateur d’une entreprise peut produire à la fois une puissance et une intelligence énormes, il lui est difficile de ne pas penser à utiliser ces deux pouvoirs pour remplacer des humains faibles et complexes.

Les entrepreneurs qui ont dirigé des entreprises géantes savent très bien à quel point il est difficile de gérer des personnes et combien il est facile de gérer des robots. Les entrepreneurs qui ont confiance dans la technologie et voient l’aube de l’AGI ne laisseront naturellement pas l’IA s’afficher simplement à l’écran.

Question plus pratique : pourquoi avons-nous besoin de l’intelligence incarnée ?

2024 ne sera pas une bonne année pour les constructeurs automobiles japonais et allemands, car d'une part, la part de marché diminue, les bénéfices ont chuté et les capacités de production commencent à apparaître superflues, d'autre part, les capacités de production sont redondantes, mais les travailleurs ; Les salaires doivent encore être payés, le capital en quête de profit envisagera naturellement des licenciements et des réductions de coûts, mais en Allemagne, où les syndicats sont forts, les difficultés sont nombreuses.

Par rapport à la production d'une voiture en Chine, le coût de production d'une voiture pour Volkswagen en Allemagne est beaucoup plus élevé. Lorsque le coût est élevé, la compétitivité diminue, la part diminue. la capacité de production n'est pas pleine, les coûts continueront. Volkswagen est entré dans un tel bourbier en Allemagne, alors Volkswagen envisage de fermer des usines en Allemagne, de réduire les salaires et de licencier des employés. Ensuite, les syndicats se sont opposés et les employés se sont mis en grève.

Après de longues négociations, Volkswagen et les syndicats sont parvenus à un accord : non pas fermer l’usine, mais licencier 35 000 personnes en Allemagne d’ici 2030.

Les intelligences incarnées ne forment pas d’unions, ce qui constitue un énorme avantage de l’intelligence incarnée.

Bien sûr, c’est du point de vue du capital.

En fait, du point de vue des gens ordinaires, la logique est très différente et les mots clés sont les mêmes : force de travail.

Pour les chefs d’entreprise, miser sur l’intelligence incorporée, c’est compter sur eux pour devenir une main d’œuvre plus efficace et à moindre coût (coût d’usage et coût de gestion).

▲ L'utilisation de vannes d'eau intelligentes dans les zones arides peut réduire considérablement les coûts de l'eau et de la main-d'œuvre, et faciliter la gestion.

Pour nous, lorsque le vieillissement sera irréversible, il y aura, comme on peut s’y attendre, une pénurie de main-d’œuvre dans les secteurs de l’agriculture de base, de l’industrie manufacturière et des services. L’intelligence et l’intelligence incarnée sont considérées comme l’une des solutions les plus efficaces. de nombreux entrepreneurs ou entrepreneurs.

Même certains propriétaires d’entreprises du secteur manufacturier ont commencé à se plaindre du fait que les jeunes sont plus disposés à livrer de la nourriture qu’à travailler dans des usines. La raison est simplement que la livraison de nourriture offre plus de liberté et des attentes en matière de revenus plus élevées, et que travailler dans une usine n’est pas coûteux. -efficace.

Concernant le processus par lequel l’intelligence incarnée devient une main-d’œuvre, tout le monde a un consensus similaire :

  • Court terme, ToB, recherche scientifique et éducative et autres scénarios, expéditions expérimentales.
  • À court et moyen terme, ToB est mis en œuvre dans des scénarios industriels. Par rapport aux robots industriels traditionnels, l'intelligence incarnée a la généralisation du cerveau et ne se limite pas à un seul type de travail. Elle s'appuie sur un châssis à roues + un bras robotique de levage +. mains/griffes/trois doigts adroits Bouger et travailler.
  • A moyen terme, ToB, sera mise en place une scène de service, plus humaine, capable d'être compétente dans le commerce de détail (tri, comptage), l'hôtellerie-restauration (collecte des repas, livraison), le nettoyage (nettoyage hors opération avion) et scénarios d'inspection (immeuble de bureaux) Travail.
  • À long terme, des scénarios de ToC et de services seront mis en œuvre pour répondre à des fonctions émotionnelles telles que le divertissement des enfants, les soins aux personnes âgées et la compagnie des adultes, ainsi qu'à des besoins complexes tels que le nettoyage et le stockage de la maison.

Quant à la durée à long terme, tout le monde ne s’accorde pas. Les optimistes pensent qu’il s’agit d’une durée de trois à cinq ans, et les conservateurs pensent qu’elle est de plus de dix ans.

Concernant l'intelligence incarnée, il existe de nombreuses situations entre les travailleurs et les propriétaires d'entreprise, et certaines semblent même contradictoires. Parfois, il y a une capacité de production redondante et trop de main d'œuvre, et parfois il y a trop peu de main d'œuvre. Mais au fond, c'est toujours le même problème. avoir le choix, En fait, les propriétaires d'entreprise n'aiment pas utiliser les gens comme main-d'œuvre, tout comme aucun enseignant n'aime être professeur, ni ajouter des subventions.

▲ La ville dans le ciel est Zalem, la photo vient des images fixes de "Alita : Battle Angel"

Dans "Gunmen", les habitants de la ville utopique "Zalem", dont le cerveau d'origine est retiré et implanté de puces cérébrales, sont ensuite gérés par des superordinateurs, qui est le modèle préféré des chefs d'entreprise.

Bien sûr, la réalité ne sera pas si sombre. D'une part, le développement des humains et des robots sera effectivement celui décrit dans "Gunsmen". Les êtres humains commenceront à devenir des cyborgs comme les habitants de "Scrapyard", à commencer par des machines externes. . Acceptez ensuite un certain degré de mécanisation du corps, depuis les personnes handicapées et malades utilisant des machines pour compléter leurs fonctions corporelles, jusqu'aux humains normaux utilisant des machines pour améliorer leurs fonctions corporelles.

D’un autre côté, l’orientation de l’intelligence incarnée va naturellement vers le développement de cerveaux intelligents et de corps flexibles comme les habitants de « Zalem », ainsi que vers l’obéissance.

Cependant, pour l'intelligence incarnée, sa complexité et sa tolérance aux pannes ne sont pas les mêmes que celles de la création d'un ChatGPT. Les grands modèles de langage ont déjà des données Internet massives comme attentes de formation, mais l'intelligence incarnée n'a pas un tel traitement pour collecter des données pour 22 robots différents. types couvrant 1 million de clips démontrant plus de 500 compétences robotiques et 16 L'exécution de dizaines de milliers de tâches relève déjà du niveau de maîtrise actuel, mais la quantité de données est bien inférieure à la quantité requise pour une excellente formation de conduite intelligente de bout en bout, sans parler de la gestion de scénarios plus complexes.

Mais plus ou moins, nous avons vu le casse-tête de l’intelligence incarnée dans des entreprises comme OpenAI, Tesla, Nvidia, Ideal, World Labs, Yushu, etc.

Stable et en amélioration.

# Bienvenue pour suivre le compte public officiel WeChat d'Aifaner : Aifaner (ID WeChat : ifanr). Un contenu plus passionnant vous sera fourni dès que possible.

Ai Faner | Lien original · Voir les commentaires · Sina Weibo