Pourquoi est-ce la plus grosse mise à jour iOS cette année ?
Bien que la perception des consommateurs à l'égard des téléphones mobiles IA et des AIPC en soit pour l'essentiel au stade conceptuel, lorsqu'Apple annoncera haut et fort qu'elle les rejoindra, l'ensemble du secteur et les consommateurs auront également de grandes attentes.
Tout comme le Vision Pro dévoilé à la WWDC l'année dernière, l'industrie des visiocasques attend avec impatience qu'Apple termine une série d'éducation du marché et ouvre une nouvelle situation. Pour les équipements d’IA, encore controversés, l’importance positive d’une adhésion géante pourrait largement l’emporter sur la menace de la concurrence.
Le journaliste de Bloomberg, Mark Gurman, a annoncé très tôt qu'Apple développait intensivement une série de fonctionnalités d'IA et prévoyait de les intégrer dans le système d'exploitation iOS 18.
À en juger par le silence d'Apple dans le passé, même s'il y a des rumeurs du monde extérieur, les idées spécifiques d'Apple pour résoudre les problèmes d'IA ne sont souvent finalisées qu'au dernier moment de la conférence de presse. de saisir quelques indices sur les développements récents d'Apple.
Récemment, un grand modèle de document publié par Apple a montré au monde extérieur les derniers progrès d'Apple dans le domaine de l'IA.
Grâce à l'application de la technologie ReALM, Siri peut désormais comprendre et identifier le contenu sur l'écran de l'utilisateur en temps réel sans s'appuyer sur des captures d'écran ou des données d'image sensibles. Tout en améliorant l'intelligence, il protège également pleinement la confidentialité et la sécurité des utilisateurs.
Imaginez un scénario dans lequel, lorsque vous exécutez la commande « Ouvrez la première application sur mon écran », Siri peut utiliser la technologie ReALM pour convertir les éléments et la disposition à l'écran en informations textuelles et exécuter la commande de l'utilisateur en conséquence.
En bref, Siri sur votre téléphone deviendra plus intelligent et vous comprendra mieux.
Le chemin de Siri vers « l’intelligence » pendant 13 ans
Siri est en passe de devenir « intelligent » depuis treize ans.
Il y a treize ans, vous seriez étonné de la fraîcheur de Siri, en l'utilisant pour régler des réveils et consulter la météo du jour, comme si une nouvelle ère d'interaction homme-machine vous faisait signe.
Treize ans plus tard, vous l'utilisez toujours pour régler le réveil et consulter la météo du jour, mais la déception a remplacé la nouveauté originale, tout comme les parents qui espèrent que leurs enfants réussiront, mais détestent que le fer ne suffise pas.
2024 : L'IA remplace les programmeurs/artistes, etc.
Siri en 2024 : Désolé, je ne t'ai pas compris
Même le fan le plus fidèle de Siri, Steve Jobs lui-même, ne s'attendait pas à ce que Siri soit absent pendant la moitié de sa vie et revienne à l'adolescence. Ce que beaucoup de gens ne savent peut-être pas, c'est que, comme iTunes, Siri a été acheté par Apple avec de l'argent réel.
Début 2010, Jobs a appelé Dag Kittlaus, le « père de Siri ». Après une réunion de trois heures, grâce aux efforts de Jobs, Siri a été embauchée par Apple en avril de la même année. Depuis lors, Siri a pénétré dans des milliers de foyers grâce au « Family Bucket » d’Apple et est devenu un symbole indélébile et emblématique dans l’histoire de la marque Apple.
Tout comme le populaire « Fruit Ninja » a progressivement familiarisé les gens avec l'expérience de l'écran tactile, la popularité de Siri a non seulement conduit à une nouvelle façon d'interagir, mais également à un changement dans les habitudes de vie. Les gens s’habituent à utiliser le langage naturel pour communiquer avec les machines et à utiliser les commandes vocales pour simplifier les tâches quotidiennes.
La commande vocale n'est qu'un changement dans la forme d'interaction. En 2011, Apple avait d'énormes ambitions et attentes pour le lancement de Siri.
Apple considère Siri non seulement comme un simple assistant vocal, mais comme un partenaire intelligent capable de comprendre les besoins des utilisateurs et de résoudre les problèmes d'aide. Comme l'a décrit le chef du marketing d'Apple, Phil Schiller, lors du lancement de Siri :
Un assistant intelligent qui peut vous aider à accomplir vos tâches grâce à des commandes vocales.
Cela se reflétait déjà dans la version originale de Siri avant son acquisition par Apple.
Dans la conception de Dag Kittlaus et d'autres, Siri devrait être un assistant capable d'obtenir des informations rapidement et avec précision, et un assistant intelligent capable de gérer avec compétence diverses tâches complexes.
La première version de Siri était capable de se connecter à 42 services réseau, couvrant des domaines allant des critiques de restaurants sur Yelp aux critiques de films sur Rotten Tomatoes et aux calculs mathématiques sur Wolfram Alpha.
En intégrant les informations de ces sites Web, Siri peut offrir aux utilisateurs une expérience de service unique sous forme de texte.
Le co-fondateur de Siri, Norman Winarsky, a un jour souligné que l'objectif initial de Siri était de comprendre les intentions de l'utilisateur, de fournir des réponses précises et d'effectuer ces tâches au nom de l'utilisateur. Lors de l'exécution, Siri collecte des données pour fournir des services plus précis à l'avenir.
Ce dont nous avons besoin n'est pas d'un moteur de recherche, mais d'un moteur de travail, c'est notre percée créative.
Ce produit peut interagir avec vous comme une personne réelle. Nous appelons cela « l'anthropomorphisme », comme un assistant amical et attentionné.
Après la prise de contrôle d’Apple, Siri a en effet progressé régulièrement dans la trajectoire de développement des assistants intelligents. Il peut non seulement répondre en douceur aux demandes des utilisateurs, mais également effectuer une série de tâches quotidiennes grâce à l'interaction vocale, telles que régler des réveils, envoyer des messages, vérifier la météo, etc.
Dans la cinquième saison de "The Big Bang Theory", Raj, un scientifique d'origine indienne, est tombé amoureux de Siri sur l'iPhone 4S au premier regard. Cet « amour » unilatéral repose également sur la capacité de base de compréhension du langage démontrée par Siri et Raj dans une communication simple.
Par conséquent, lorsque Siri est sorti, les médias technologiques étrangers l'ont également massivement loué.
The Verge a un jour souligné que la meilleure chose à propos de Siri est son fonctionnement – au moins dans de nombreux scénarios, son niveau dépasse les attentes des utilisateurs. CNN a clairement comparé Siri à « l'assistant intelligent de nos rêves », toujours disponible lorsque vous l'appelez. Le New York Times l'a également salué, soulignant que Siri a profondément remodelé la définition du téléphone mobile en gagnant du temps et en réduisant les opérations redondantes.
Le rythme de l'histoire n'avance pas toujours selon un rythme prédéterminé. Parfois, même si nous tournons en rond, nous ne trouvons pas le rythme du progrès.
Tout comme vous demandez à Siri d'aller vers l'est, mais il ira occasionnellement vers l'ouest, la nouveauté constitue pour Siri la « joie à première vue » de l'utilisateur, mais la stagnation crée également « l'ennui après une longue période » de l'utilisateur.
Le lendemain du lancement de Siri d'Apple, Steve Jobs est malheureusement décédé d'un cancer, jetant un voile difficile à dissiper sur le développement de Siri. Un ancien employé d’Apple n’a pas pu s’empêcher de soupirer dans une interview avec The Information :
Jobs est mort le lendemain du lancement de Siri et Apple a perdu son chemin.
En outre, les changements fréquents au sein de l'équipe de direction d'Apple et les luttes entre factions internes au sein de l'entreprise ont également eu un impact considérable sur le bon développement de Siri. Dans des articles précédents, APPSO a également analysé les raisons pour lesquelles Siri est devenu « stupide ». (https://mp.weixin.qq.com/s/7oDXkASTZgGIjKJaFWPLkQ)
Sous l'attaque de facteurs internes et externes, le rythme de développement de Siri, qui était à son apogée lors de ses débuts, s'est progressivement ralenti, et il est progressivement devenu un « étudiant stupide » du « maître académique » du passé.
Le point final de « l’intelligence » de Siri est aussi le point de départ
J'ai entendu dire que Siri d'Apple avait « régressé » ? Et c'est une si bonne chose !
La popularité soudaine de ChatGPT a démontré au monde les performances exceptionnelles des grands modèles de langage (LLM) dans les domaines de la compréhension, de la génération, de l'interaction et du raisonnement du langage. Elle a également donné à Siri l'opportunité de revenir au point de départ : devenir une intelligence capable de vraiment comprendre et répondre au langage naturel.
Il n'y a pas si longtemps, Kittlaus, le « père de Siri », a également partagé sa vision de l'IA Siri sur X et a répertorié une série de scénarios d'application.
Siri, pouvez-vous m'avertir lorsque Chris Malinchak sort une nouvelle chanson et demander à Spotify de l'ajouter à mon dossier Chill Beats ?
Siri, s'il te plaît, réveille-moi à 7 heures du matin les mardis et jeudis et à 8 heures les autres jours de la semaine. Ne me dérangez pas le week-end, sauf si vous voyez un rendez-vous le matin sur mon calendrier ; si vous avez un rendez-vous le matin, veuillez me réveiller rapidement.
En 2024, Apple fera preuve de force dans le domaine de l’IA générative, et Siri pourrait être le support d’interaction le plus important.
Lors de la précédente réunion de rapport financier, le PDG d'Apple, Cook, a révélé de manière inhabituelle au monde extérieur que l'entreprise « innoverait » dans le domaine de l'IA générative en 2024, et a même souligné à plusieurs reprises qu'Apple annoncerait des plans pour l'IA générative plus tard cette année. . Nouvelles importantes.
Comparé à l'annonce selon laquelle le rêve d'Apple de construire une voiture s'est brisé après dix ans, ce qui est encore plus frappant est que certains des employés d'Apple qui étaient à l'origine responsables du projet de construction automobile seront réaffectés à la recherche et au développement de systèmes génératifs. Projets d'IA.
Apple investit également massivement dans l’IA générative. En tant qu'entreprise la plus valorisée au monde, Apple, avec ses poches profondes, se concentre sur l'achat et la vente et accélère l'accumulation de technologie et le rythme de l'innovation grâce à des acquisitions.
Selon le dernier rapport publié par la société d'études de marché Stocklytics, Apple a acquis 32 sociétés d'IA en 2023, se classant au premier rang dans la liste des acquisitions des grandes entreprises technologiques.
Dans le même temps, en examinant les documents de recherche de l'équipe d'apprentissage automatique d'Apple au cours de l'année écoulée, nous pouvons clairement voir qu'Apple attache une grande importance à la faisabilité d'exécuter de grands modèles sur des appareils finaux.
En janvier de cette année, l'équipe d'apprentissage automatique d'Apple a discuté en profondeur d'une méthode permettant de résoudre « l'exécution de grands modèles sur la mémoire d'un téléphone mobile » dans un article récemment publié, fournissant de nouvelles idées techniques pour résoudre les goulots d'étranglement informatiques sur les appareils mobiles.
Dans l'article mentionné au début, les chercheurs d'Apple ont également annoncé que, bien que ReALM ait une taille de paramètre plus petite, il surpasse même GPT-4 sur certains indicateurs clés.
Alors sous quelle forme AI Siri nous sera-t-elle présentée ? Avant l’arrivée de la WWDC 2024, nous pourrons peut-être nous inspirer du camp Android.
Lors de la conférence HarmonyOS 4 en août de l'année dernière, Yu Chengdong a annoncé la capacité de l'assistant intelligent Xiaoyi à accéder à de grands modèles d'IA. Immédiatement après, Lei Jun a révélé que Xiaomi avait utilisé un grand modèle avec 1,3 milliard de paramètres sur son téléphone mobile et que les effets de certaines scènes étaient comparables à ceux du cloud.
Aucun des téléphones portables nationaux « Yuwujia » n'a été laissé sur place. L'assistant OPPO Xiaobu basé sur AndersGPT, Honor Magic 6 équipé d'un grand modèle AI côté terminal 7B et Vivo équipé d'une matrice grand modèle Blue Heart ont également été officiellement annoncés l'un après l'autre.
Grâce à la bénédiction des grands modèles, ces assistants vocaux sont impressionnants en termes de génération de rédaction, de dessin d'images, etc., mais par rapport aux assistants vocaux précédents, leurs scénarios d'application ne sont pas différents.
Si AI Siri veut réinventer son intention initiale et devenir un véritable assistant intelligent, il doit au moins remplir les conditions de base suivantes :
Premièrement, devenir plus intelligent, c'est-à-dire améliorer ses capacités de traitement du langage naturel grâce à la technologie des grands modèles ; deuxièmement, adopter une interface vocale d'abord pour optimiser l'expérience interactive de l'utilisateur ; troisièmement, ouvrir le statut d'îlot de toutes les applications et parvenir à une intégration transparente des données. et fonctions. , faisant de Siri un véritable assistant intelligent pour tous les scénarios.
Bien qu'il ne soit pas facile d'isoler l'une des trois conditions ci-dessus, certaines expériences de pionniers de l'industrie peuvent également être utilisées à titre de référence.
Sur la voie de l'IA générative, le raccourci le plus rapide est parfois d'aller de pair. Il n'y a pas si longtemps, on a appris qu'Apple, "à la traîne", négociait avec Google, OpenAI et d'autres sociétés pour intégrer des services d'IA générative dans iOS. 18.
Comparé à « entendre clairement votre langue », « comprendre ce que vous voulez dire » est le principal obstacle à l’interaction vocale. Même Steve Jobs a trouvé cela difficile au cours de sa vie :
La reconnaissance vocale est un sujet très passionnant pour les 10 prochaines années. Le problème auquel il est confronté n’est pas seulement la façon de reconnaître la parole. Lorsque vous parlez à quelqu’un, comprendre sa langue est bien plus difficile que simplement reconnaître la parole.
…Cette question est assez difficile. Donc, jusqu’à ce que nous le résolvions, vous ne pouvez qu’espérer ce merveilleux avenir.
Comment répondre avec précision aux besoins d'éveil de l'utilisateur dans divers environnements bruyants et complexes, et comment passer de la compréhension sémantique à la compréhension de la mémoire afin que Siri puisse mémoriser et analyser le contexte et le contexte de l'utilisateur et fournir des services et des suggestions plus intelligents. étape clé franchie par Siri sur la voie de l’intelligence.
C’est là que le matériel d’IA actuel est performant.
Quant à l'élimination des barrières entre les applications, l'intégration des logiciels et du matériel est secondaire. Dans l'écosystème applicatif actuel, des questions telles que le partage des données et la protection de la vie privée sont les pierres d'achoppement devant Apple.
Il y a treize ans, les gens auraient pu acheter un iPhone pour découvrir Siri. À cette époque, Siri n'était pas seulement une fonction, mais représentait également une nouvelle façon d'interagir, un moyen d'explorer l'avenir de la vie.
Treize ans plus tard, Siri, qui a perdu son aura d'antan, est progressivement passé d'un pôle d'innovation à une fonction supplémentaire commune, voire même devenu superflu dans la vie de certains utilisateurs.
Avec le soutien d’une technologie de grande envergure, depuis les clics et tapotements froids jusqu’à la communication vocale chaleureuse, nous espérons que Siri ne sera pas seulement un système intelligent, mais aussi un partenaire complet capable de comprendre notre langage, nos émotions et nos besoins.
Ce type de Siri nous fournira des services plus personnalisés et plus attentionnés, et rendra également l'utilisation de la technologie plus humaine et plus chaleureuse.
# Bienvenue pour suivre le compte public officiel WeChat d'aifaner : aifaner (ID WeChat : ifanr). Un contenu plus passionnant vous sera fourni dès que possible.
Ai Faner | Lien original · Voir les commentaires · Sina Weibo