Vivo utilise l’IA pour créer une île omnipotente

Aifaner se concentre sur les « produits de demain ». La rubrique philosophie dure tente de se débarrasser du voile de la technologie et des paramètres et d'explorer l'origine de la nature humaine dans la conception des produits.

Lorsqu'on parle d'assistants IA, deux métaphores sont souvent utilisées, mais sont les plus appropriées : Jarvis d'Iron Man et le film de science-fiction "Her".

Il ne s’agit pas seulement d’un assistant vocal plus intelligent, mais laissez-nous voir la forme idéale d’IA OS.

Jarvis peut faire bien plus que simplement déclencher une alarme et ouvrir une application, mais peut effectuer presque toutes les tâches qui doivent être accomplies sur les systèmes et les appareils. Cela nécessite l'utilisation de l'IA pour reconstruire l'expérience interactive du système de bas en haut, et même. reconnaître les intentions des utilisateurs.

"Her", exprimé par Scarlett Johansson, crée une expérience utilisateur riche en chaleur et en émotion, reflétant le renforcement du lien émotionnel entre l'interaction homme-machine à l'ère de l'IA, et cette expression émotionnelle nécessite souvent des changements subtils de voix, ce qui est le cas. quelque chose que de nombreuses IA n’ont pas actuellement.

Une telle forme ne peut pas être réalisée uniquement par un modèle ou un matériel puissant, mais nécessite une intégration profonde de l’IA et des systèmes.

Sur la dernière version d’OriginOS 5 de vivo, je vois de nouvelles avancées dans cette tentative. Bien qu’il y ait eu d’innombrables téléphones IA au cours de l’année écoulée, c’est peut-être le moment où l’IA et le système d’exploitation mobile seront plus complètement intégrés.

L’un des signes clés est que pendant l’expérience, je n’ai pas pu percevoir l’existence de la technologie de l’IA la plupart du temps, et la meilleure technologie devrait être « transparente ».

À l’ère de l’IA, la fluidité du système doit être redéfinie

Pendant longtemps, les utilisateurs ont essentiellement jugé la fluidité du système en fonction du fait qu'il soit bloqué ou non. Cela reste bien sûr un critère très important. Mais à l’ère de l’IA, l’exigence de fluidité du système va au-delà de la simple recherche d’une vitesse « rapide ».

Cette fois, le mécanisme de registre de stockage Ledger d'OriginOS 5 reconstruit l'intégralité du système de gestion de la mémoire pour prendre en charge une expérience interactive fluide à partir de la technologie sous-jacente.

Dans le même temps, il coopère avec une série de technologies pionnières d'OriginOS pour optimiser l'interaction, telles que la « planification injuste », « l'informatique hétérogène », la « carte graphique virtuelle », etc. pour garantir la fluidité du système.

Parmi eux, dans des scénarios d'utilisation à haute fréquence tels que naviguer sur TikTok et regarder WeChat, l'amélioration de la fluidité d'OriginOS 5 peut être clairement ressentie.

En effet, OriginOS 5 peut allouer automatiquement de la mémoire en fonction des scénarios d'utilisation. Après avoir utilisé Douyin pendant plus d'une heure, l'utilisation de la mémoire est inférieure de 15 % à celle de l'ancien système. WeChat, un géant de la mémoire, peut également voir la vitesse de chargement de. amélioration des milliers de messages non lus.

Par rapport à la fluidité d'utilisation de l'application, ce qui me surprend le plus dans OriginOS 5, ce sont certaines expériences qui ne sont pas de nature intuitive. « Naturel » ne signifie pas « intuitif », et une interaction naturelle avec l'interface utilisateur doit permettre aux utilisateurs de se sentir intuitifs, agréables et confortables.

Un grand nombre de fonctions d'OriginOS 5 prennent en charge l'éveil global. Par exemple, si je souhaite appeler l'assistant IA "Blue Heart Little V", la méthode la plus couramment utilisée consiste à appuyer longuement sur le bouton d'alimentation. Vous pouvez également utiliser la voix. , appuyez longuement avec deux doigts, ou appuyez longuement sur la barre de navigation en bas de l'écran.

L'avantage de l'évocation globale est que vous pouvez essentiellement trouver le chemin le plus court qui correspond le mieux à vos habitudes d'utilisation sur chaque interface pour effectuer l'opération souhaitée.

Dans le scénario de recherche, un appui long sur l'écran avec deux doigts pour afficher la « Recherche Little V Circle » est plus intuitif. Après avoir sélectionné la pièce à rechercher, la reconnaissance d'intention de Lanxin Little V sera déclenchée pour recommander automatiquement les services requis. , comme interroger des informations sur une encyclopédie ou créer un calendrier de rappel.

En fait, la recherche par sélection de cercles n'est pas une nouvelle fonctionnalité, mais il existe deux détails optimisés dans OriginOS 5. L'un est que la sélection de cercles est plus précise et que le contenu peut être sélectionné et identifié en traçant des lignes, des cercles et des pressions longues, et le l’autre concerne les services de recommandation active.

La recherche IA est de nos jours utilisée par de plus en plus de personnes. La raison importante est qu’elle peut effectuer une recherche en utilisant le langage naturel au lieu de mots-clés. En même temps, elle peut également servir d’assistant. En plus de fournir un résultat, elle peut également analyser. vos besoins et apporter plus d'aide.

Lorsque des interactions et des systèmes similaires sont intégrés de manière transparente, tel est le véritable sens du terme « fluidité ».

OriginOS 5 s'appelle AIOS by vivo pour la première fois. L'essence de ce qu'on appelle AIOS est de fournir une expérience utilisateur plus naturelle et plus confortable, de comprendre les besoins réels des utilisateurs et de simplifier les étapes d'obtention de services.

Bill Buxton, un pionnier dans le domaine de l'interaction homme-machine, a un jour énuméré dans un article les principes que l'interface utilisateur naturelle NUI devrait suivre, dont un :

La simplicité avant tout : la complexité est l’ennemie des interfaces utilisateur naturelles. Chaque interaction doit être explicite et ne nécessiter aucun manuel d’instructions.

Il existe de nombreux détails sur OriginOS 5 qui peuvent produire un plaisir « intuitif » dans les interactions .

Par exemple, la commutation dynamique de différentes opérations telles que les notifications de messages, les petites fenêtres vidéo et les recherches est cohérente. Cette conception peut sembler discrète, mais si vous basculez rapidement entre plusieurs petites fenêtres, vous pouvez bénéficier des avantages d'une perception visuelle cohérente. de coordination.

Nous pensons que le flux naturel du système et le meilleur effet est de couler comme l'eau.

La simplicité est la sophistication ultime. La simplicité est la complexité ultime : dans la nature, l'eau est la substance la plus appropriée pour exprimer cette qualité.

L'eau est la substance la plus douce au monde, mais elle peut pénétrer dans la roche la plus dure du monde.

Mettez de l’eau dans une tasse et elle prend la forme de la tasse ;

Mettez de l'eau dans une théière et elle prendra la forme d'une théière ;

Mettez de l'eau dans la bouteille et elle prendra la forme de la bouteille.

L'eau peut couler, siffler, goutter ou entrer en collision, et l'eau change selon la situation.

L'interaction du système la plus naturelle et la plus fluide, c'est-à-dire dans divers scénarios d'utilisation, est comme l'eau, qui est du brouillard et de la rosée dans le ciel et une source au sol.

Il ne s’agit pas seulement d’une question d’esthétique de conception, mais aussi de ce à quoi devraient ressembler les applications d’IA une fois mises en œuvre.

Une île omnipotente dans votre téléphone mobile

Au début de l'année, Ai Faner a avancé dans ifanRank que l'IA deviendrait le nouveau système d'exploitation pour les smartphones et que les grands modèles seraient au cœur du système d'exploitation intelligent.

Le système peut comprendre le langage naturel de l'utilisateur et comprendre progressivement ses intentions sur la base d'une formation de données locales. Les services et fonctions fournis par les applications précédentes sont intégrés de manière transparente dans le système et appelés, et l'utilisateur n'a qu'à exprimer ses besoins.

Lorsque l’ensemble de l’interface interactive deviendra une super intelligence, la façon dont nous utilisons les téléphones mobiles changera également.

Dans OriginOS 5, Lan Xin Xiao V a également été mis à niveau vers un agent, capable de comprendre les intentions des utilisateurs comme les humains, de prédire les besoins à l'avance et de fournir une expérience utilisateur qui s'améliore de plus en plus avec vous.

Les agents constituent aujourd'hui une direction de recherche importante dans l'industrie de l'intelligence artificielle, en dehors des grands modèles, et devraient apporter d'énormes progrès dans le domaine de l'IA, estime même Bill Gates :

Les agents ne changeront pas seulement la façon dont chacun interagit avec les ordinateurs. Ils bouleverseront également l’industrie du logiciel, provoquant la plus grande révolution informatique depuis que nous sommes passés de la saisie de commandes au clic sur des icônes.

Les améliorations d'efficacité apportées par OriginOS 5 grâce à l'IA sont indissociables de quatre mots : reconnaissance d'intention , qui est aussi la mise à jour la plus surprenante de ce système.

La reconnaissance d'intention est la plus évidente dans "Atomic Island". Tant que je glisse et dépose du texte, des images et d'autres contenus sur l'île atomique, ils seront placés sur l'île atomique par ordre de priorité en fonction des services prévus nécessaires pour la prochaine étape. .

Lorsque je glisse et dépose une adresse, la première chose qui s'affiche est la navigation cartographique, et je peux y accéder directement.

Lorsque je discutais, j'ai reçu un lien de mot de passe vers une plateforme d'achat en ligne, je l'ai glissé et déposé pour ouvrir directement le saut.

Lorsque je reçois des notifications pour différentes réunions du groupe, je peux les glisser-déposer pour créer immédiatement un planning.

L'efficacité du flux d'informations a été considérablement améliorée, ce qui est particulièrement utile lorsque je parcoure des informations dans diverses applications. Lorsque je vois du texte et des images que je souhaite partager, je peux les glisser-déposer directement pour les envoyer à des amis WeChat, ou. notez-les rapidement dans mes notes.

De plus, utiliser Atomic Island avec Little V Circle Search peut ouvrir un nouveau monde.

Par exemple, j'ai recherché des guides de décoration d'intérieur à Xiaohongshu. Non seulement je peux les partager avec ma famille ou enregistrer des notes en les faisant glisser et en les déposant sur Atomic Island, mais je peux également encercler les images et donner des liens d'achat.

Dans les scénarios de bureau, je peux également utiliser Atomic Island et certaines applications d'IA pour créer un flux de travail plus efficace.

Lorsque je participe à une réunion en ligne, j'active « Little V Helper » pour activer les sous-titres en temps réel. Si je communique avec des amis étrangers ou si je regarde des émissions en direct en langues étrangères, je peux également faire office d'interprète simultané et enregistrer. le résumé dans Atomic Notes.

Je peux utiliser la petite fonction d'écriture V pour rationaliser ou développer en fonction de mes besoins, et je peux également ajuster le style de langage, par exemple, je peux rendre le style d'écriture plus approprié et plus formel.

Ensuite, je le glisse et le dépose sur Atomic Island et je l'envoie à différents collègues qui ont besoin de collaborer. Cela peut améliorer considérablement l'efficacité dans les scénarios où vous devez fréquemment promouvoir des projets en interne et en externe.

Une logique d'utilisation similaire s'applique à de nombreuses applications, et les services d'application les plus couramment utilisés peuvent également être personnalisés, ce qui vous permet d'explorer des scénarios plus intéressants en fonction de vos besoins.

Actuellement, les applications tierces couramment utilisées prennent essentiellement en charge le glisser-déposer d'Atomic Island, notamment WeChat, Douyin, Meituan, Alipay, Xiaohongshu, Weibo, Amap, etc., couvrant les applications à haute fréquence pour les nécessités quotidiennes, la nourriture, le logement et les transports.

Au cours de ma période d'utilisation, Atomic Island a été assez précis pour identifier mes intentions de glisser-déposer. Tout comme la lampe magique d'Aladdin, il y a une personne Blue Star à l'intérieur pour vous aider à réaliser vos souhaits et peut vous fournir les services que vous souhaitez sans même faire de vœu.

De plus, il existe un œuf de Pâques plus attendu en termes d'IA : l'assistant de réservation de Xiao V (PhoneGPT). Tant que vous entrez les exigences de commande, le système peut automatiquement ouvrir Dianping pour rechercher des restaurants et utiliser l'IA pour passer des appels téléphoniques. pour réserver des restaurants auprès de commerçants au nom de l'utilisateur.

Une fois la réservation réussie, AI enverra immédiatement une carte contenant l'adresse du restaurant et les informations de contact à l'utilisateur. Vous pouvez accéder au restaurant d'un simple clic ou l'enregistrer dans le planning comme rappel programmé.

Il s'agit d'un état idéal pour le fonctionnement des agents intelligents. L'IA peut non seulement apprendre à comprendre les intentions opérationnelles de l'utilisateur, mais également simuler des êtres humains pour effectuer des opérations fonctionnelles. L'utilisateur n'a pas besoin d'opérer au premier plan d'une interface ouverte tierce. .

Il y a quelques années, Google a également lancé un service de réservation téléphonique IA appelé Duplex, qui peut vous aider à louer une voiture, à réserver des billets de cinéma et des places au restaurant, mais il n'était pas encore mature. Plus tard, les médias ont découvert que de nombreuses réservations IA. fournis par ce service ont en fait été complétés manuellement.

Mais cela démontre l’énorme potentiel des applications de l’IA. Avec les capacités croissantes des grands modèles, les explorations comme Vivo offrent de nombreuses possibilités de mise en œuvre. Cette nouvelle forme d'interaction homme-machine permet aux utilisateurs d'obtenir des services sans aucun sens. Ils n'ont pas besoin de se soucier de l'application elle-même. Le service doit s'ajuster automatiquement en fonction des besoins de l'utilisateur.

Ce changement dans le concept d’interaction se reflète également dans le Canvas récemment lancé par OpenAI, estime Karina Nguyen, directrice de recherche d’OpenAI :

Dans mon esprit, l’interface AGI ultime est une toile vierge.

Elle peut évoluer et se transformer en fonction des préférences humaines, et inventer de nouvelles façons d’interagir avec les humains, redéfinissant ainsi notre relation avec la technologie de l’IA et Internet dans son ensemble.

Contrairement à de nombreuses IA, les fonctions d'IA d'OriginOS 5 sont non seulement « intelligentes », mais semblent également plus « humaines ».

Lorsque vous réveillez Lan Xin Xiao V avec votre voix, vous pouvez sentir que le ton super-anthropomorphe intégré du système est plus proche des humains, sans aucun sentiment de dissonance. Vous pouvez également choisir parmi une variété de dialectes et même prendre en charge des langues minoritaires telles que le miao, qui ne sont parlées que par des millions de personnes.

Ces 7 dialectes peuvent également être reconnus et convertis en texte dans « vivo Listening and Speaking », ce qui signifie que cette fonctionnalité d'accessibilité est non seulement utile pour les utilisateurs malentendants, mais que les utilisateurs ordinaires peuvent également l'utiliser pour communiquer avec des utilisateurs de différents dialectes.

Il y a aussi quelques détails bien pensés dans "vivo Hearing". Par exemple, un double-clic sur le texte peut l'agrandir et l'afficher à l'envers, ce qui facilite la visualisation par la personne à qui vous parlez et réduit les barrières de communication.

Ce qui m'impressionne le plus, c'est le timbre personnalisable. Rien qu'en lisant un morceau de texte, le système peut entraîner votre timbre à devenir la voix de "Blue Heart Little V". J'ai demandé à ma femme de personnaliser sa voix pour moi, et même elle a été surprise que la voix ressemble autant à la sienne. Cela a également accru ma volonté d'utiliser la communication vocale et téléphonique.

Alors que la technologie de génération d'IA continue de rafraîchir la cognition sensorielle des gens, nous avons besoin de ressentir une expérience chaleureuse et émotionnelle dans l'interaction homme-machine.

Bill Buxton estime que l'interface utilisateur naturelle NUI devrait être capable de détecter le contexte de l'utilisateur, y compris la position, la posture, l'émotion, etc., et d'ajuster dynamiquement la méthode d'interaction en fonction de ces informations, afin que l'interface puisse fournir une expérience plus personnalisée et plus pertinente. expérience.

L'expérience interactive d'IA d'OriginOS 5 commence à se rapprocher d'un tel NUI, nous permettant de véritablement commencer à avoir notre propre Jarvis sur nos téléphones mobiles.

Conception originale d'OriginOS 5, système d'exploitation AI « transparent »

Il y a deux mille ans, l'architecte romain Vitruve proposait trois principes d'architecture dans son livre « Dix livres sur l'architecture » : Firmitas, Utilitas et Venustas. Ces trois principes de base sont considérés comme les principes éternels de la conception architecturale et ont ensuite évolué vers la durabilité, la commodité et le plaisir.

Ces principes ne sont pas seulement applicables au domaine de l’architecture, mais ont également un impact profond sur la réflexion moderne en matière de conception de produits. La pensée humaniste de Vitruve basée sur le « peuple » est en réalité un concept de « conception originale ».

Cela fait écho par coïncidence à la philosophie de conception d'OriginOS à travers le temps et l'espace. L'« Origine » dans OriginOS ne fait en fait pas référence à l'origine ou à l'origine, mais au retour à l'origine des choses, y compris l'origine du monde physique et l'origine des besoins humains. .

Le design est l'origine, l'origine est le design

Qu'il s'agisse d'éliminer les interfaces redondantes, de simplifier les opérations et de revenir aux méthodes d'interaction les plus intuitives et naturelles, ou d'utiliser l'IA pour percevoir l'environnement et le statut des utilisateurs, comprendre leurs besoins fondamentaux et leurs véritables intentions, et rapprocher les retours et les services du monde physique. . , sont tous la réponse d’OriginOS 5 au « design original ».

En nous appuyant sur les idées de Vitruve et en les combinant avec une expérience réelle, nous pouvons résumer les principes de conception d'OriginOS 5 comme suit :

  • Naturel : offrez une expérience interactive naturelle et fluide et réduisez la charge cognitive des utilisateurs.
  • Efficace : utilisez l’IA pour parvenir à une adaptation intelligente et à une connaissance de la situation, et répondre de manière proactive aux besoins des utilisateurs.
  • Plaisir : Se concentrer sur les besoins émotionnels et esthétiques des utilisateurs pour créer une expérience interactive et visuelle agréable.

La technologie idéale doit être « transparente » afin que les utilisateurs ne puissent pas ressentir l'existence de la technologie et se concentrer sur l'expérience elle-même.

L’interaction « transparente » d’OriginOS 5 est une manifestation du « retour aux origines des besoins humains ». Les gens sont habitués à recevoir des commentaires directs et immédiats dans le monde physique, et OriginOS 5 apporte cette expérience dans le monde numérique, la rendant familière et confortable pour les utilisateurs.

Cela me rappelle la voie d'interaction homme-machine évoquée par le chroniqueur du New York Times John Markoff dans le livre "Dancing with Robots", IA (Intelligent Augmentation). Il a souligné que l'IA et les humains sont dans une relation de collaboration, et que les machines devraient l'être. une expansion des capacités humaines, pas un remplacement.

Pour utiliser un concept plus populaire, il s'agit d'un copilote, un copilote qui assiste le pilote principal dans le fonctionnement de l'avion. Lorsque le pilote principal a besoin de se reposer ou d'effectuer d'autres tâches, le copilote prendra le contrôle, et les deux. sont conjointement responsables de l’exploitation de l’avion.

En 1980, Steve Jobs comparait l'ordinateur personnel à un « vélo pour l'esprit ». Pourquoi pas une voiture, un avion ou une fusée, mais un vélo ?

Cette déclaration provient d'un article du magazine "Scientific American". L'auteur a découvert que bien que la vitesse absolue des vélos ne puisse être comparée à celle des transports motorisés, si l'on calcule les calories brûlées par kilomètre parcouru, le taux de cyclisme humain est le plus élevé. encore plus haut qu'un avion.

L’essence de cette métaphore est que quel que soit le périphérique informatique, il doit être basé sur les personnes. Les produits intelligents basés sur l’IA devraient devenir les « vélos pour le cerveau ».

Le philosophe Robert Nozick estime que « la sagesse est la connaissance de choses importantes, et cette connaissance devient ici la caractéristique de la pensée et du comportement d'une personne (sage) ».

La sagesse d’aujourd’hui ne vient pas seulement des organismes à base de carbone, mais elle se nourrit également de l’intelligence basée sur le silicium. Ce que nous voyons dans OriginOS 5 n'est pas seulement une mise à jour de la technologie, mais aussi une compréhension approfondie et une réponse aux besoins humains.

Ce n’est qu’en revenant à l’essentiel que nous pourrons avoir un aperçu de l’avenir.

# Bienvenue pour suivre le compte public officiel WeChat d'aifaner : aifaner (ID WeChat : ifanr). Un contenu plus passionnant vous sera fourni dès que possible.

Ai Faner | Lien original · Voir les commentaires · Sina Weibo