Xiaoyi dans Wenjie M7 ouvre une nouvelle entrée dans l’expérience de vie intelligente à scénario complet de Huawei

Récemment, il y a eu une nouvelle de dernière heure dans le domaine de l'IA. Un ingénieur logiciel de Google pense que le modèle Google AI LaMDA a une "conscience de soi" et a publié un rapport de dialogue de 21 pages pour le prouver, mais j'ai encore un peu peu de "réveil de l'IA" Douteux.

L'IA s'est-elle vraiment développée à ce point ? Après tout, même l'assistant vocal, la technologie d'intelligence artificielle la plus utilisée, est souvent qualifié par les utilisateurs de "retard mental artificiel". Même dans la scène de conduite où l'assistant vocal peut jouer son meilleur rôle, de nombreux conducteurs âgés autour de moi choisissent de laisser il mange des cendres.

La sortie estivale de Huawei d'hier, Huawei a sorti le deuxième modèle de la marque AITO construit conjointement avec Celis, le M7. J'ai également expérimenté ce modèle pour la première fois. Dans le cockpit Hongmeng du M7, je ne m'attendais pas à me prendre Le plus gros la surprise n'est pas l'intérieur, les sièges et l'audio, mais l'assistant vocal Xiaoyi.

En tant qu'utilisateur senior de Huawei, je connais assez bien les capacités de Xiaoyi, mais cette fois, elle m'a tout de même apporté une nouvelle expérience, et j'ai également commencé à comprendre le sentiment de l'ingénieur logiciel de Google, car cette IA ressemble trop à des personnes.

L'éveil de l'IA ? Xiaoyi dans AITO M7 est trop "humain"

Le taux d'adoption de la fonction d'interaction vocale intelligente dans les voitures particulières chinoises a atteint 86 % en 2021, mais en fait de nombreux conducteurs utilisent rarement cette fonction, car ces instructions que même les enfants peuvent facilement comprendre, « l'IA est difficile à comprendre.

En 2016, une vidéo d'un chauffeur du Shandong "avertissant" l'assistant vocal dans la voiture est toujours une vidéo populaire à la station B. Le frère aîné du chauffeur voulait que l'assistant vocal passe un appel, mais peu importe combien de fois il l'a dit, la voix avec une voix douce L'assistant ne pouvait pas comprendre.

Des expériences similaires peuvent être familières à de nombreux conducteurs. D'après ma propre expérience, au moins ces situations me font perdre patience avec l'assistant vocal de la voiture :

  • Après être monté dans la voiture et avoir démarré, si vous souhaitez utiliser l'assistant vocal pour régler plusieurs fonctions telles que la climatisation, la ventilation des sièges, la navigation et l'audio, vous devez vous réveiller à plusieurs reprises et vous devez attendre qu'il se réveille après la diffusion à chaque fois. L'efficacité peut être plus lente que le manuel.
  • Lorsque vous voyagez avec votre famille et vos amis, l'assistant vocal peut être dérangé par le son du copilote et de la banquette arrière. Si vous le touchez accidentellement ou que vous n'entendez pas la commande, vous pouvez également faire taire tout le monde avant d'émettre une commande vocale, mais c'est embarrassant d'y penser Les ours sont aussi un danger pour la sécurité.
  • Après avoir réveillé l'application sur l'écran de la voiture via l'assistant vocal, certaines opérations doivent encore être glissées ou tapées manuellement.

Dans l'expérience de Wenjie M7, je me suis également concentré sur le test des performances de Huawei Xiaoyi dans les scénarios ci-dessus.

Perception intelligente de la zone multi-sonore : artefact de voyage en famille

Lors d'un voyage en famille, vous avez peut-être rencontré une telle situation embarrassante : la voiture est pleine de petits et grands, le conducteur veut changer de chanson, le copilote veut régler le siège, le passager arrière veut ouvrir la vitre, et il y a des enfants ours.Crier, vous devez être distrait en conduisant pour répondre aux différents besoins de votre famille.

Cette fois, la perception intelligente de la zone multi-son sur le M7 peut enfin résoudre ce problème. Xiaoyi peut identifier avec précision les commandes de différentes positions dans la voiture, telles que le conducteur principal, le copilote et la rangée arrière, et le personnel dans le la voiture peut envoyer indépendamment des commandes à Xiaoyi. .

J'ai simulé la scène d'un voyage en famille. Différents sièges dans la voiture étaient pleins de monde. En même temps, j'ai donné différentes instructions à Xiaoyi. Xiaoyi peut fournir des services à temps selon nos instructions, et peut également désactiver la zone sonore. où se trouve l'enfant ours, l'empêcher de causer des ennuis.

Pour réaliser une telle expérience, une excellente collaboration logicielle et matérielle est nécessaire.Tout d'abord, grâce au réseau de microphones répartis autour de la voiture, Xiaoyi peut identifier les sources sonores dans différentes positions, puis filtrer le bruit des sources sonores non ciblées pour identifier avec précision la source sonore. .

À l'heure actuelle, il existe en fait de nombreuses voitures qui prennent en charge les zones multi-son, mais certaines d'entre elles sont dues au manque d'une bonne adaptation des algorithmes d'IA et des logiciels et du matériel, le taux de reconnaissance correct n'est pas élevé, ou il doit être très fort ou près du micro pour réussir, et l'expérience est inégale.

Lorsque mes collègues et moi faisons l'expérience de la perception multi-tons de Xiaoyi, nous pouvons essentiellement donner des instructions en douceur avec notre voix parlée et notre posture assise habituelles, et l'expérience est assez fluide.

Dialogue continu : c'est l'état de parler aux gens

Comme mentionné précédemment, la perception de zones sonores multiples doit éliminer les sources sonores gênantes afin que Xiaoyi puisse reconnaître les commandes qui doivent être entendues. Lorsqu'elle le fait bien, elle peut naturellement réaliser une autre fonction pratique : le dialogue continu.

Pour le dire simplement, vous pouvez émettre directement plusieurs commandes à Xiaoyi en même temps, sans avoir à la réveiller à chaque fois, vous pouvez également l'interrompre au milieu, et Xiaoyi peut automatiquement bloquer les commandes invalides en répondant à un message vocal ou en discutant avec un quelques mots. , Xiaoyi peut supporter 60 secondes de dialogue continu.

C'est une fonction très utile pour les conducteurs. Par exemple, après être monté dans la voiture, je fixe un objectif de navigation, puis j'ajoute un waypoint, puis j'allume la climatisation, la ventilation des sièges, et enfin j'ouvre le podcast que je n'ai pas écouter la dernière fois, tout d'un coup.

De plus, cette fois, Xiaoyi a également ajouté une commande rapide du conducteur principal sans se réveiller, vous n'avez donc pas besoin d'appeler Xiaoyi à chaque fois que vous opérez, ce qui est plus efficace et ne sera pas gênant lorsqu'il y a beaucoup de monde dans la voiture. .

Dans le passé, j'utilisais rarement la voix pour contrôler ces fonctions dans la voiture. Ce n'est pas que la voiture ne le supporte pas, mais je dois appeler xx camarades de classe N fois, et je dois attendre que chaque commande soit exécutée, ce qui est beaucoup moins rapide que mon opération manuelle.

Visuellement parlant : utilisez le son comme une souris et libérez vos mains

Bien qu'il existe de plus en plus de fonctions pouvant être contrôlées par l'assistant vocal embarqué, après avoir ouvert certaines fonctions de l'application par la voix, des opérations telles que dérouler des pages, changer d'onglet, etc. nécessitent encore souvent de cliquer sur l'écran. sont cachés plus profondément, entrez dans la recherche de menu à plusieurs niveaux, il y a des risques pour la sécurité dans la conduite.

Sur Wenjie M7, ce genre d'expérience interactive inhumaine commence à être valorisé et amélioré par les constructeurs. Xiaoyi prend en charge "visuel et parlant", et les fonctions affichées à l'écran peuvent être directement contrôlées par la voix, tout comme utiliser la voix comme une souris pour "glisser et cliquer" directement, et vous n'avez plus à le faire.

Cette fonction est également adaptée à un grand nombre d'applications tierces, j'ai testé les applications les plus utilisées comme Himalaya et QQ Music, qui sont très fluides.

Non seulement cela, mais les utilisateurs n'ont pas à mémoriser des instructions très précises. Xiaoyi peut comprendre des expressions telles que "le premier". Ils n'ont pas à passer plus de temps à regarder l'écran, et ils sont moins susceptibles d'être distraits pendant conduire. , c'est bien.

Suggestion de Xiaoyi : comprenez-moi vraiment

En parlant de l'écran de contrôle central, même si c'est la première fois que j'expérimente le Wenjie M7, je ne suis pas étranger à l'opération.C'est peut-être parce que je me suis habitué à utiliser le système Hongmeng sur mon téléphone portable. -l'expérience automobile a également un peu changé.

"Xiaoyi Suggestion" sur le téléphone mobile me rappellera les informations de livraison express sur le chemin du travail, recommandera des restaurants et d'autres informations en fonction de ma position. Dans Wenjie M7, "Xiaoyi Suggestions" peut également évaluer le statut de l'utilisateur en fonction des habitudes de conduite et des scènes, et donner des suggestions correspondantes.

Par exemple, lorsque le niveau de carburant/l'électricité est trop bas, Xiaoyi Suggestion avertira de manière proactive la station-service/station de recharge à proximité et vous demandera si vous devez naviguer. Même si vous sortez de la voiture et oubliez de prendre votre téléphone, Xiaoyi prendra l'initiative de vous le rappeler.

On peut voir que s'il s'agit d'une demande passive ou d'une demande active, Xiaoyi a pu porter un jugement plus précis. Et le flux continu de Xiaoyi du téléphone portable à la voiture me donne l'impression que l'expérience d'interaction voiture-machine du M7 est très similaire à celle d'un smartphone.

Voix personnalisée : un œuf de Pâques humain

Dans cette expérience, j'ai également trouvé un œuf de Pâques de Xiaoyi qui m'a surpris, qui est la voix personnalisée, ce qui signifie que je peux remplacer la voix de Xiaoyi par la voix de ma famille, de mes amants ou de mes amis, il suffit d'enregistrer une voix, Xiaoyi va bientôt apprendre.

Selon la norme Microsoft MOS, une méthode d'évaluation de la qualité vocale reconnue internationalement, plus la voix de l'IA est proche de la voix humaine, plus elle est confortable. De plus, Xiaoyi soutient également la reconnaissance du cantonais, du dialecte du Sichuan et d'autres dialectes, et je n'ai finalement pas à me disputer avec elle avec une bouchée de "melon d'hiver bouilli".

Dans le film de science-fiction "Her", le protagoniste masculin est tombé amoureux d'un assistant vocal IA, en grande partie à cause de la voix de l'IA. Bien sûr, combien de garçons peuvent résister à la voix de Scarlett Johansson ?

Des voix familières peuvent faire apparaître Xiaoyi comme une personne émotive, le processus d'interaction est plus réel et naturel et je suis plus disposé à communiquer avec elle. Si vous transformez la voix de Xiaoyi en la personne que vous aimez, même s'il n'est plus à vos côtés, ne serait-ce pas quelque chose de romantique ?

De plus, Xiaoyi prend également en charge les mots de réveil personnalisés, et le sentiment général ressemble plus à une communication avec des amis autour de vous, ce qui semble refléter la future interaction vocale de Huawei, qui va évoluer vers l'anthropomorphisme.

Bien que l'IA actuelle sur le marché n'ait pas vraiment atteint le niveau "d'éveil de la conscience", après cette expérience, l'impression que Xiaoyi a sur moi ressemble en effet de plus en plus à un être humain, du moins je peux essayer de communiquer avec elle comme une personne normale .

Cela me rappelle aussi Jarvis, le majordome de l'IA dans Iron Man.Après plus de 10 ans, peut-on enfin espérer avoir un vrai "Jarvis" ?

À quelle distance est Jarvis de nous ?

La semaine dernière, l'Union européenne a adopté une proposition visant à interdire la vente de véhicules à carburant à partir de 2035, et l'industrie automobile inaugure son plus grand changement depuis l'ère industrielle. Les "quatre nouvelles modernisations" (électrification, mise en réseau, intelligence et partage) sont devenues une tendance dans l'industrie. À l'avenir, l'industrie automobile passera d'une bataille matérielle à une bataille de données et de systèmes.

Le jugement du PDG du groupe Volkswagen, Herbert Diess, sur l'avenir de l'industrie automobile devient réalité :

À l'avenir, la voiture deviendra l'un des appareils Internet les plus complexes mais les plus précieux.

À l'avenir, les passagers utiliseront la voiture plus fréquemment et le temps d'utilisation pourrait doubler.

Demain, la voiture ne sera plus une simple boîte, mais un espace plus confortable et chaleureux.

L'intelligentisation des automobiles est une tendance irréversible, parmi laquelle l'interaction vocale est devenue la fonction centrale des usines automobiles pour construire une expérience intelligente. Avec le développement de la technologie de conduite autonome, l'assistant vocal deviendra sans aucun doute le plus important vecteur d'interaction homme-véhicule à l'avenir, et on peut même dire qu'il est l'un des nouveaux "trois éléments majeurs" de la nouvelle ère automobile.

Cela nécessite un assistant vocal intelligent qui peut communiquer avec vous comme un humain, ce qui est aussi l'impression que Xiaoyi m'a donnée. Du point de vue de l'expérience statique, je pense que l'expérience intelligente de Xiaoyi sur Wenjie M7 appartient déjà au premier échelon des assistants vocaux embarqués.

Récemment, Xiaoyi a également obtenu la première certification faisant autorité de niveau A de l'assistant vocal automobile de CATARC. Il a obtenu de bons résultats dans 18 tests, y compris le téléphone, la navigation, le contrôle de la voiture, la visibilité pour parler, la réponse au réveil, l'association sémantique et le multi- interaction ronde Excellent, confirme encore mon jugement.

En d'autres termes, Xiaoyi est peut-être l'un des assistants vocaux de voiture actuels capables de communiquer avec les utilisateurs de la manière la plus humaine possible.

L'IA progresse à un rythme beaucoup plus rapide que les humains, et il ne devrait pas être trop surprenant que des assistants vocaux comme Xiaoyi améliorent leur compréhension. Mais c'est encore loin de "Jarvis", car l'intelligence de "Jarvis" ne se reflète pas seulement dans son intelligence, mais peut être profondément intégrée et adaptée dans presque toutes les scènes, devenant un majordome universel couvrant toutes les scènes.

Sur le territoire de Huawei, cela pourrait être la forme ultime de Xiaoyi.

La nouvelle entrée de Huawei pour une expérience de vie intelligente dans tous les scénarios

Dans la vague de fabrication de nouvelles voitures , l'expérience d'interaction homme-ordinateur du cockpit intelligent représenté par Wenjie M7 devient de plus en plus abondante. Et ces fonctions ne servent pas seulement la conduite elle-même, mais commencent à s'étendre à des scénarios de vie numériques connectés à la voiture, tels que le contrôle des appareils domestiques intelligents avec la machine de la voiture, et même vous donner des suggestions basées sur la scène d'aller au travail ou quitter le travail.

Ce type de développement semble être le cas lorsque les smartphones sont apparus, que des scénarios de services autres que les appels ont émergé les uns après les autres et que les téléphones mobiles sont progressivement devenus un vecteur important de la vie numérique des personnes. Maintenant, Huawei peut également être en mesure d'utiliser le cockpit intelligent pour améliorer sa propre écologie interconnectée de tous les scénarios, de sorte que le "terminal mobile" de la voiture deviendra une entrée importante dans l'écologie intelligente.

Il n'est pas difficile de connecter plusieurs scénarios, mais il n'est pas facile de rendre l'interaction entre les bornes écologiques intelligente et fluide. L'expérience d'interconnexion de protocoles tels que Bluetooth et ZigBee utilisés dans le passé équivaut à donner à des ponts fragiles à une seule planche des "îlots isolés" qui ne peuvent pas résister au vent et aux vagues, comme des côtes de poulet.

La tâche de Xiaoyi est d'aider l'interaction d'un grand nombre de terminaux dans l'écosystème Huawei à devenir automatisée.

En d'autres termes, Xiaoyi sera un autre point d'entrée important pour l'équipement écologique complet de Huawei . À l'heure actuelle, Huawei a progressivement atteint une collaboration transparente entre les terminaux et tous les scénarios grâce à HarmonyOS.À l'avenir, tous les appareils de l'écosystème de Huawei pourront fournir aux utilisateurs davantage de services intelligents basés sur des scénarios sous la direction de Xiaoyi, un assistant intelligent. , la localisation et les habitudes comportementales, mobilisent les fonctions pertinentes de l'appareil pour fournir le service le plus approprié à l'utilisateur au moment le plus approprié.

Lorsque Xiaoyi, plus intelligent et plus "humain", relie de manière transparente les trois scénarios de home-car-carry-carry, il intègre les ressources matérielles, les capacités du système et l'écologie des services, et fait des suggestions basées sur les intentions de l'utilisateur et les exécute efficacement. Ensuite, nous avons vraiment le "Jarvis" d'Iron Man, et la magie de la technologie nous a une fois de plus fait entrer dans une nouvelle ère.

Huawei finira par devenir une "super entreprise de terminaux" sur cette base, tout comme nos vues précédentes sur l'avenir de Huawei :

L'hyperterminal ne dépend pas du nombre de types de terminaux, mais du contrôle des composants de base et des systèmes d'exploitation, du contrôle et de l'influence de l'écosystème et de l'exploration prospective de l'interaction homme-ordinateur.

#Bienvenue pour prêter attention au compte WeChat officiel d'Aifaner : Aifaner (WeChat : ifanr), un contenu plus excitant vous sera apporté dès que possible.

Love Faner | Lien d'origine · Voir les commentaires · Sina Weibo