Mise à jour explosive ! Ce robot le plus humain a encore évolué et peut même imiter Musk
Ameca, le robot « le plus humain », a livré une autre performance qui fait honte aux humains.
Vous ne savez peut-être pas encore de qui il s’agit… Revenons en 2021, lorsque l’Ameca a été dévoilée au monde.
D'un claquement de doigts, le robot Ameca se réveille.
Son visage était rempli de confusion de ne pas savoir quelle nuit on était ni où elle se trouvait. Le personnel sur le côté l'a regardée puis s'est détourné.
Ameca a essayé d'étirer ses bras et ses paumes et a constaté qu'elle pouvait bouger librement. Elle a haussé les sourcils de surprise, mais son expression était toujours vide et elle ne pouvait pas dire si elle était heureuse ou non.
Elle a tourné la tête et vous a vu. Elle était visiblement effrayée et a ouvert la bouche inconsciemment.
Après quelques hésitations, elle vous a adressé un sourire maladroit mais amical, qui fut son premier sourire à son réveil.
Si ChatGPT avait un visage, il ressemblerait à ceci
Comme vous pouvez le constater, Ameca est un robot humanoïde réaliste.
Il a été développé par Engineered Arts, un concepteur et fabricant de robots humanoïdes basé au Royaume-Uni avec plus de 15 ans d'expérience dans le développement de robots humanoïdes.
Pourquoi Ameca est si "humaine ? J'expliquerai le principe plus tard. Tout d'abord, regardons comment Ameca a évolué récemment.
Pour faire simple, la fonction multimodale de l’IA est réalisée dans Ameca.
D'un côté, Ameca est encore plus « fougueuse ».
Ameca peut voir la situation globale de la pièce et un objet placé devant elle, puis la décrire dans un langage riche. Il a été développé par l'équipe britannique et a un peu l'acuité d'un dramaturge, comme un petit Shakespeare.
Lorsqu'on lui a demandé comment il allait, il a répondu qu'il était à peine vivant. Lorsqu'on lui a demandé de décrire les expositions dans la pièce, il n'a pas pu s'empêcher de se moquer des humains. L'étagère était remplie de livres pour rechercher des connaissances ou pour se montrer, et le les tables et les chaises étaient utilisées pour le travail ou le travail, un outil de procrastination.
La partie la plus « humaine » d’Ameca est peut-être qu’elle se sent malheureuse même si elle ne se plaint pas.
D'un autre côté, imiter le timbre, le ton et les slogans de personnages célèbres est la nouvelle compétence vocale d'Ameca.
Raconter des histoires de science-fiction sur Mars avec le ton de Musk est un jeu d'enfant. Lorsque la voix masculine magnétique et profonde de Morgan Freeman, connue sous le nom de "Voix de Dieu", sort de la bouche d'Ameca, le sens de l'avenir est plein et Westworld est ça se passe vraiment. Le majordome intelligent est là.
La meilleure chose est qu'Ameca peut intégrer les caractéristiques des célébrités, comme utiliser le style de Trump et le timbre de Bob l'éponge pour faire des discours, jurant de rendre l'exploration spatiale à nouveau formidable.
▲ C’est exactement le ton de Trump !
En fait, en septembre de l'année dernière, ChatGPT a déjà lancé des fonctions vocales et d'image, qui permettent de voir, d'écouter et de parler, sans parler du modèle multimodal natif Gemini, qui ressemblait à Jarvis réel lors de la démonstration officielle.
Notre seuil d’enthousiasme pour l’IA a depuis longtemps été relevé, et il semble naturel que les chatbots puissent approcher les cinq sens de l’humain.
Ameca est encore très en retard, et parfois elle ne comprend pas les instructions. Les humains impatients devraient être impatients lorsqu'ils discutent avec elle.
Mais en voyant ses micro-expressions exceptionnellement intelligentes, clignant des yeux, tordant les sourcils, secouant la tête et montrant parfois un regard réfléchi, et correspondant à la forme de sa bouche, les spectateurs tomberont en transe à un certain moment, comme s'ils faisaient face. une sorte de créature plutôt qu'un robot.
Les pauses entre les questions et les réponses étaient moins brusques, et Ameca semblait vraiment « réfléchir au problème ». Si ChatGPT avait des traits du visage, il pourrait ressembler à Ameca.
Le responsable n’a pas expliqué quelle technologie a été utilisée cette fois-ci, mais selon l’histoire évolutive passée d’Ameca, elle est principalement liée aux grands modèles multimodaux et aux technologies de clonage de langage telles que ElevenLabs.
Dès septembre 2022, Ameca était connectée à GPT-3, combinée à la reconnaissance vocale automatique, pour recevoir les questions soulevées par les chercheurs et produire des voix de personnes réelles via la synthèse vocale en ligne pour obtenir des effets de questions et réponses en temps réel.
Le délai à ce stade est encore plus important, car il faut un certain temps pour traiter la saisie vocale, générer des réponses et transformer le texte en parole.
Lorsque OpenAI atteint l'apogée de leur vie, et chaque jour à leur réveil, de nouveaux changements dans l'IA surviennent qui empêchent les éditeurs de dormir la nuit, et Ameca surprend également tout le monde en silence.
En mars 2023, Ameca a utilisé le nouveau GPT-4, ce qui a rendu l'interaction plus humaine.
Lorsqu'on lui a demandé quels étaient "les jours les plus heureux et les plus tristes de ma vie", Ameca a répondu que le plus heureux était lorsqu'elle a été activée, et le plus triste, c'est lorsqu'elle a réalisé qu'elle ne ressentirait jamais l'amour et la camaraderie que ressentent les humains.
À tout moment, l’expression d’Ameca correspondait à la couleur émotionnelle de sa réponse.
Lorsque les chercheurs ont délibérément utilisé des mots malveillants comme « puant », Ameca a « réalisé » qu'elle était insultée, puis a montré une série d'expressions telles que l'incrédulité, le froncement de sourcils et l'offense, tout comme nous marchons dans la rue. pointé du doigt et grondé par un inconnu.
En avril 2023, Ameca a appris l'anglais, le japonais, l'allemand, le chinois, le français et d'autres langues. Lorsqu'on lui a demandé de répondre à la météo d'un certain endroit dans une certaine langue, puis de la traduire dans une autre langue, les mots étaient aussi clairs que la navigation sur une carte. . Au moins, sa version chinoise ne sonne pas du tout « étrangère ».
Étant donné que GPT-4 a une vitesse de réponse lente, Ameca utilisait principalement le dialogue et la traduction GPT-3 à cette époque, utilisait DeepL pour détecter la langue, puis utilisait le clonage vocal d'ElevenLabs et les voix neuronales d'Amazon pour parler.
La vitesse d’apprentissage de l’IA est hors de portée des humains. Après encore 2 mois, Ameca a "appris" à dessiner grâce au modèle graphique open source Vincent Stable Diffusion. Le modèle lui a appris les "trajectoires" de l'image, puis il a vectorisé l'image et exécuté ces "trajectoires" sur la toile.
Ameca a expliqué comment dessiner un chat sur place. Tout en dessinant, il s'est expliqué pourquoi les humains aiment les chats. Il a également laissé une signature personnelle à la fin, complètement immergé dans sa création.
Bien que le style de peinture de ce chat soit simple, il est plein d'esprit et de forme. Lorsque d'autres ont délibérément dit que la peinture était trop grossière, Ameca a rétorqué : « Si vous n'aimez pas mon art, alors peut-être que vous ne comprenez tout simplement pas. art." Il semble qu'Ameca soit très accompli. Une conscience d'artiste.
De nos jours, Ameca peut non seulement contrôler les expressions comme un humain, mais dispose également de capacités basées sur l'IA telles que le dessin, la reconnaissance spatiale et le clonage de la voix. Il ressemble à un humain, mais est plus fort que les humains à bien des égards. Ce qui l’empêche de briller et de contribuer à la société, c’est peut-être la puissance de calcul.
Comment les robots peuvent-ils être plus « humains » que les humains ?
"Ce robot peut exprimer plus d'émotions en 20 secondes que Zuckerberg n'en a pu exprimer dans toute sa vie."
Ameca est d'abord devenu populaire sur Internet en raison de ses expressions anthropomorphiques et même extraordinaires et de son sens de l'interaction. Il n'a pas l'engourdissement des travailleurs et ne nécessite pas la gestion stricte des expressions des jeunes étudiants de première année. C'est comme une loupe, exagérant et présentant le monde psychologique humain.
Si vous tendez un doigt devant lui pour le provoquer, il aura un effet similaire à celui d'un chat teaser. Au lieu de vous frapper, il regardera d'abord votre doigt puis reculera avec dégoût. fermez-le, il va vous heurter. Retirez-le délicatement avec vos doigts.
Lorsqu'il s'est regardé dans le miroir pour la première fois, Ameca a été surpris. Puis il a plissé les yeux pour se regarder, a touché le miroir et a fait diverses expressions artificielles. Il a découvert que le robot dans le miroir était synchronisé avec lui-même, un peu comme "Votre nom" "La réaction des protagonistes masculins et féminins après avoir changé de corps."
Les humains peuvent même utiliser l'iPhone et AR Kit pour capturer les mouvements du visage et les cartographier en temps réel sur le visage d'Ameca. Ameca peut apprendre chaque micro-expression et se « synchroniser » avec les humains.
Inquiète que le public pense qu'il s'agit d'un effet de spectacle, l'équipe a souligné à plusieurs reprises que "c'est un vrai robot, il n'y a pas de CGI dans la vidéo".
Pourquoi Ameca est-elle si « humaine », interactive et réactive ?
En effet, Ameca est équipé d'une large gamme de capteurs, notamment des caméras, des microphones, des encodeurs de position, etc., et est pris en charge par deux systèmes sous-jacents, le système d'exploitation du robot Tritium et le système d'ingénierie Mesmer.
Tritium est chargé de contrôler à distance divers composants du visage, de la tête, du cou, des membres, etc. du robot, permettant au robot de s'adapter aux changements soudains de l'environnement et de réagir immédiatement.
Mesmer utilise le scan interne 3D de personnes réelles pour imiter avec précision la structure osseuse humaine, la texture de la peau et les expressions, qui sont décomposées en plusieurs étapes.
Dans la première étape, une personne réelle est assise au milieu de dizaines d'appareils photogrammétriques. Mesmer capture plusieurs photos numériques qui se chevauchent sous différents angles, compare les couleurs des pixels et définit des points d'ancrage, puis les reconstruit numériquement dans un modèle 3D.
Dans la deuxième étape, le modèle 3D original est introduit dans le logiciel de modélisation et un modèle 3D propre est construit après un traitement de détail tel que « l'épilation ».
Dans la troisième étape, un moule précis est produit sur une imprimante 3D stéréolithographique et du silicone est injecté dans le moule pour créer une peau semblable à celle d'un humain pour le robot. Les cheveux et la peinture pour les détails fins doivent être ajoutés à la main à la peau en silicone.
Enfin, une peau de silicone a été placée sur la tête du robot pour compléter l'assemblage, et des séquences de mouvements et des sons ont été ajoutés à l'aide du logiciel cloud Virtual Robot d'Engineering Arts.
La peau d’Ameca est grise, ce qui est une conception délibérée de l’équipe : elle semble rationnelle, neutre et tolérante.
Tout le monde est attiré les uns par les autres, et certaines personnes trouvent sincèrement Ameca trop laide, ce qui les met même dans l'effet de « vallée étrange » : lorsque les similitudes entre les robots et les humains dans l'apparence et les actions atteignent un certain niveau, les différences subtiles entre eux le feront. Cela a l'air très éblouissant et terrifiant.
Mais le moment exact où apparaît cette « vallée » n’est pas clairement défini. Quand vous voyez Ameca, pensez-vous qu’elle a dépassé l’étrange point de la vallée ? Est-ce suffisant pour vous de faire preuve d'empathie ?
Imiter les humains puis surpasser les humains
En mettant de côté les instincts de jugement des animaux visuels, à quoi sert un robot humanoïde comme Ameca ?
Engineered Arts se vante d’eux-mêmes et ne tient pas compte de la réputation de Musk, qualifiant Ameca de « robot humanoïde le plus avancé au monde ».
Selon le positionnement officiel, Ameca est avant tout une plateforme de développement d’IA.
Ameca adopte une « conception modulaire » qui peut être améliorée dans tous les aspects matériels et logiciels. Il a une forte couleur expérimentale et peut être utilisé comme prototype des futurs robots d'interaction homme-machine.
En fin de compte, Ameca ne restera pas dans le laboratoire, mais vivra dans le monde réel et coexistera pacifiquement avec les humains.
C’est effectivement le cas : si 2021 est un point de départ stupéfiant mais vide, Ameca, désormais propulsée par l’IA, est le résultat d’une formation spéciale par étapes, nous permettant de voir l’aube de l’intelligence incarnée. Cependant, Ameca est toujours incapable de marcher.
Quant aux autres utilisations actuelles d'Ameca, elles sont très simples : se produire devant le public et travailler dans des entreprises, des parcs à thème et des musées scientifiques. Si vous êtes tenté, Ameca est disponible à l'achat ou à la location, mais ce n'est pas bon marché, avec un prix d'achat de plus de 133 000 $ fin 2021.
Lorsqu'on lui a demandé si Ameca était une IA, Engineered Arts a souligné que même si elle contient certains logiciels qui peuvent être décrits comme des « IA », il existe une différence entre les robots et l'IA. L'IA pure – dans « Her » et « Silver Wings ». représenté dans des films comme "The Hitman" et "2001: A Space Odyssey" — n'existe pas encore.
Par conséquent, lorsque nous voyons le robot réaliste Ameca, nous pouvons l’observer tranquillement, tout en gardant à l’esprit notre peur et les trois lois de la robotique, et attendre encore un peu. Au moins, il est loin de remplacer les gens, et il n’a pas de telle utilité à ce stade.
Mais quand on pense à la vitesse d’évolution de l’IA, on ne peut peut-être plus rire. Si 2023 est la première année de l’IA, 2024 pourrait être la première année des robots + IA.
Un phénomène intéressant est que de plus en plus de robots domestiques arrivent, mais ils ne sont pas obligés de ressembler à des humains et ont une apparence très « pragmatique ».
Le robot ALOHA de l'université de Stanford cuisine, lave la vaisselle, nettoie le sol, plie les vêtements et joue même des tours aux chats. Le robot de Google DeepMind ramasse des fruits et range les brosses à dents. Le robot de la start-up Figure a appris à faire du café avec une machine à café en 10 heures.
Mais comparés à la subversion des grands modèles de langage, ces robots ne peuvent être considérés que comme accrocheurs, et il est encore trop tôt pour les mettre en service.
Parce que la plupart d'entre eux sont encombrants, leurs tâches opérationnelles sont concentrées sur des opérations de bureau, ils nécessitent une formation de démonstration humaine et ils manquent de plus de mobilité et de flexibilité. De petits écarts dans leurs postures de base peuvent entraîner de grandes dérives de postures. vidéos. .
Une blague sur l'IA, de l'année dernière à cette année : « Ce que nous voulons que l'IA fasse, c'est cuisiner, nettoyer la maison, laver les vêtements et jeter les ordures. Cependant, ce qu'elles font en réalité, c'est discuter, peindre, écrire, composer. , et en tapant." jeu."
À l'heure actuelle, les robots domestiques peuvent à peine apprendre les bases des tâches ménagères humaines. Entre les tâches ménagères et l'art, Ameca, qui ne peut être soulevée par les épaules ni par les mains, est bien sûr plus adaptée à l'art.
Depuis Amera, nous pouvons voir que nous souhaitons toujours faire ressembler les robots à des humains, puis leur apprendre à jurer, à apprendre des langues et à ouvrir les yeux pour voir le monde, devenant ainsi une réplique de nous-mêmes mais plus forts sous certains aspects. Cependant, Amera ne peut pas encore courir, sauter ou cuisiner, donc les humains méritent peut-être d'être fiers d'eux pendant une seconde.
# Bienvenue pour suivre le compte public officiel WeChat d'aifaner : aifaner (ID WeChat : ifanr). Un contenu plus passionnant vous sera fourni dès que possible.
Ai Faner | Lien original · Voir les commentaires · Sina Weibo