Exposition privilégiée de l’équipe Siri d’Apple : Luttes, luttes, restructuration

Microsoft a investi dans OpenAI et a lancé le nouveau Bing, Google a lancé Bard, Adobe a lancé FireFly, Amazon a lancé Amazon Titan, et avec la popularité de ChatGPT, les outils ou assistants d'IA des grandes entreprises de la Silicon Valley ont éclaté en un instant.

▲ Fonction copilote de Github

Seul Apple, qui est situé dans un coin de la Californie, semble au monde extérieur être un monde qui n'est pas perturbé par l'IA.

silence

Après avoir vécu la folle Marche de l'IA, grandes et petites entreprises se sont succédées sur le terrain de l'AIGC, elles vont toutes marquer la version Beta test et doivent passer par une étape de liste d'attente.

Ils peuvent finir par se tromper, ils peuvent ne pas répondre à la question, et ils peuvent même provoquer un pic d'opinion publique, mais la Silicon Valley et nous aimons toujours y participer.

Relativement parlant, Apple est toujours resté silencieux sur l'AIGC, et ni les dirigeants ni les employés n'ont exprimé le véritable point de vue d'Apple à ce sujet.

Apple a toujours accordé une grande attention au maintien de sa propre image et de la marque de son entreprise, et annonce rarement des produits ou des technologies immatures au monde extérieur.

Par conséquent, cela explique également pourquoi Apple est toujours plus lent que les autres entreprises pour les nouvelles technologies.

Apple fait de son mieux pour éviter les phénomènes inacceptables lorsque de nouvelles technologies sont appliquées aux produits.

À l'heure actuelle, la plupart des produits de l'industrie AIGC tournent encore autour de boîtes de dialogue de page Web, et l'application qui tue est encore à un stade vierge.

Il est logique pour Apple, qui se concentre sur les produits, de ne pas commenter.

Cependant, selon les informations obtenues à partir des informations, les ingénieurs d'Apple prévoient de combiner le grand modèle de langage LLM avec Siri pour lancer un Siri plus intelligent, qui sera naturellement appliqué à l'iOS de l'année prochaine.

Tout comme en 2011, Apple a annoncé pour la première fois l'assistant intelligent Siri, et il est allé sur le marché avec l'iPhone 4s, devenant une mise à niveau fonctionnelle majeure de l'iPhone cette année-là.

haut profil

À en juger par la perspective actuelle, Apple a ajouté un moteur neuronal à la puce, qualifiant la puce SoC de "bionique" et appliquant divers modèles et algorithmes d'intelligence artificielle à la photographie, la biométrie, l'écriture, etc.

Il est souvent difficile pour les gens de remarquer la grande optimisation et l'amélioration de l'expérience utilisateur. L'utilisation de l'IA par Apple est assez discrète.

Mais en 2011, Siri a été dévoilé comme la technologie d'intelligence artificielle la plus en vue d'Apple.

▲ Scott Forstal

Jusqu'à présent, je me souviens encore que lorsque Scott Forstall a présenté Siri, il a déclaré que Siri peut comprendre le langage naturel, n'exige pas que les utilisateurs se souviennent de formats et de grammaires spécifiques et peut également être personnalisé en fonction des habitudes de l'utilisateur.

Dans la vidéo promotionnelle de suivi, Siri est vraiment devenu un assistant intégré au téléphone mobile qui répond toujours correctement et qui est assez intelligent et humain.

C'est juste que l'itération technique de Siri semble avoir stagné après 2011. Plus de dix ans après, il suit toujours la réponse « naïve » de 2011.

Lorsque les gens sont constamment rafraîchis par les assistants vocaux plus avancés d'autres entreprises, Siri semble un peu maladroit et trop mignon.

En particulier, Siri a maintenant couvert presque tous les appareils Apple, y compris l'iPhone, l'iPad, le Mac et même les AirPods.Les méthodes de traitement et de réponse légèrement démodées de Siri le rendent encore plus obsolète.

Même Apple est déçu de Siri en interne.L'équipe de développement d'appareils XR d'Apple ne veut pas utiliser Siri pour contrôler les appareils et les fonctions sur les appareils XR car il n'est pas assez intelligent.

À cette fin, Mike Rockwell, le responsable des équipements XR, a également envisagé de trouver une alternative pour remplacer la commande vocale de Siri, mais a finalement échoué.

Le casque Apple XR selon la rumeur sera toujours similaire aux autres appareils Apple, avec des commandes simples utilisant Siri, et bien sûr, une simple conversation avec lui si vous le souhaitez.

escalader

La sortie de Siri est considérée comme un tournant dans l'histoire des smartphones. Après Siri, presque tous les fabricants de smartphones lanceront un assistant intelligent similaire pour leurs produits, afin de ne pas prendre de retard.

Quant à Apple, il a dépensé 200 millions de dollars pour acquérir Siri Inc. en 2010 et a intégré Siri dans l'iPhone un an plus tard.

Après cela, Apple a également formé une équipe d'assistants intelligents Siri.Cependant, de 2011 à 2018, l'équipe Siri est tombée dans la confusion et il y a eu des débats sur la gestion interne et la direction générale.

▲ John Giannandrea

La solution d'Apple est "d'inviter un expert." En 2018, John Giannandrea a été embauché de Google pour devenir le vice-président senior d'Apple en charge de l'intelligence artificielle et de la stratégie d'apprentissage automatique.

Avant cela, il était responsable des activités de recherche et de l'intelligence artificielle chez Google, et il peut presque être considéré comme un expert senior dans le domaine de l'intelligence artificielle de Google.

Avec l'ajout de John Giannandrea, Apple veut s'appuyer sur son expérience pour améliorer progressivement le statu quo de Siri et aider Siri à rattraper ses concurrents.

John Giannandrea a également apporté une atmosphère de travail de type Google à l'équipe Siri, et lorsque les dirigeants d'Apple avaient besoin de changements immédiats dans Siri, il utilisait le processus de "gravir la montagne" pour expliquer comment résoudre les problèmes rencontrés par le domaine de l'IA artificielle intelligence.

Pour Siri, ou la stratégie d'intelligence artificielle d'Apple, il doit y avoir un objectif à long terme, au cours duquel chaque petite optimisation et changement s'accumulera progressivement au fil du temps, et cela ne doit pas être bâclé.

En d'autres termes, John Giannandrea estime que la fondation d'Apple dans l'intelligence artificielle est trop faible pour se précipiter.

De plus, il a également convaincu la haute direction d'Apple que pour le moment, ils devraient se concentrer sur la constitution d'équipes, conserver les talents pertinents et leur donner plus de liberté pour rechercher et développer leurs propres orientations.

Plus important encore, John Giannandrea a considérablement augmenté le niveau de salaire de l'équipe d'intelligence artificielle aux normes de l'industrie.

Après trois tours, l'équipe d'intelligence artificielle d'Apple a été renforcée, de nombreux anciens experts en intelligence artificielle de Google ont été introduits et la startup d'apprentissage automatique Laserlike a été acquise pour 150 millions de dollars.

Ses trois fondateurs, Srinivasan Venkatachary, Steven Baker et Anand Shukla, sont devenus plus tard l'équipe Siri, experts dans le domaine LLM et le domaine de recherche d'Apple.

Le but de l'introduction de Laserlike est en fait d'améliorer les capacités de recherche de Siri, et Venkatachary est naturellement devenu le chef de l'équipe de recherche d'Apple.

En 2019, Apple a ajouté à Siri la possibilité de répondre aux questions des utilisateurs via des informations sur le réseau. La fonctionnalité de Siri est progressivement complétée et améliorée.

Cependant, ces changements ressemblent plus à "un feu de paille".

Il existe de nombreux projets au sein de l'équipe d'intelligence artificielle d'Apple, notamment le projet BlackBird qui peut porter Siri sur l'iPhone, et SiriX, un projet qui célèbre le dixième anniversaire de Siri.

Cependant, en plus de la concurrence interne, les hauts dirigeants d'Apple sont trop lents à prendre des décisions sur l'orientation générale de l'intelligence artificielle, et ils sont trop conservateurs dans l'utilisation des nouvelles technologies telles que les LLM.

▲ De A à un autre A Image de : l'information

À l'automne 2022, Srinivasan Venkatachary, Steven Baker et Anand Shukla ont également quitté Apple pour Google.

Fait intéressant, le PDG de Google, Sundar Pichai, a personnellement recruté l'équipe de trois personnes, et Tim Cook l'a également retenue.

Mais ils pensent que Google est une entreprise adaptée à la recherche de LLM, et qu'elle sera rapidement appliquée aux produits.

Maintenant, ils étudient chez Google comment réduire le coût de formation des grands modèles de langage et comment améliorer la précision.

Non seulement l'équipe Laserlike, mais aussi la plupart des autres experts et équipes recrutés par Giannandrea ont quitté Apple, car Apple ne semble pas accorder beaucoup d'attention à la recherche sur l'intelligence artificielle.

Après l'arrivée de John Giannandrea, en train de gravir la montagne dans le domaine de l'intelligence artificielle, c'était peut-être différent de la direction stratégique générale de l'entreprise, qui a mis l'intelligence artificielle d'Apple en difficulté.

lutte

La protection de la vie privée est une stratégie au niveau de l'entreprise qu'Apple a récemment suivie.

Face à cela, tout doit être compromis et jamais compromis.

John Giannandrea a rejoint Apple avec un objectif clair de rendre Siri plus intelligent en optimisant l'utilisation par Apple des données utilisateur et des algorithmes de formation.

Parce que, dans des entreprises comme Google et Amazon, il est courant de collecter et d'analyser les données des utilisateurs pour améliorer les modèles d'algorithmes de produits.

De plus, grâce à ce processus, l'algorithme sera plus intelligent et l'IA deviendra plus intelligente.

Apple collectait auparavant des données de conversation entre Siri et les utilisateurs sans se souvenir de l'ID, mais il ne l'a pas fait de manière professionnelle et n'a pas non plus utilisé ces données pour améliorer Siri.

Avec l'arrivée de John Giannandrea, Apple a trouvé de nombreuses sociétés d'externalisation pour collecter des données pertinentes, et a finalement optimisé Siri grâce à un processus.

Mais en 2019, The Guardian a révélé que l'équipe d'externalisation d'Apple écoutait les conversations entre les utilisateurs et Siri sans leur consentement, ce qui a provoqué un tollé, en particulier pour Apple, qui s'est toujours concentré sur la confidentialité.

À cette fin, Apple a finalement remplacé les sous-traitants par des employés à temps plein et a modifié les processus et politiques internes pour qu'il soit presque impossible pour les employés ordinaires d'entendre les enregistrements de conversation de Siri.

De telles réglementations rendent également plus difficile pour l'équipe d'intelligence artificielle d'optimiser en temps réel et d'itérer à temps, et c'est aussi l'une des raisons pour lesquelles Siri semble très classique à l'heure actuelle.

"Les lacunes de ce qu'ils font deviendront de plus en plus évidentes", a déclaré Pedro Domingos, professeur d'informatique à l'Université de Washington et auteur du livre d'apprentissage automatique "The Master Algorithm (The Master Algorithm)". données afin d'être plus compétitif avec les autres.

▲ Tim Cook Photo tirée de : Bloomberg

Et pour certaines des réponses étranges de Siri qui se précipitent souvent vers des recherches à chaud, cela attirera également l'attention de Tim Cook. Ignorera souvent le processus et demandera directement à l'équipe Siri de modifier les réponses "embarrassantes".

Pour réduire la collecte de données en raison de la protection de la vie privée, éviter les réponses embarrassantes et apporter des corrections manuelles, Apple attache une grande importance à son image d'entreprise.

Par conséquent, même si Apple dispose désormais d'énormes fonds et ressources, de nombreux anciens membres de l'équipe d'intelligence artificielle d'Apple pensent qu'il est difficile pour Apple de déployer bientôt Siri basé sur LLM.

De plus, Apple a également fixé de nombreuses règles dans Siri, comme par exemple demander le prix d'un iPhone, il privilégiera le détournement vers le site officiel d'Apple au lieu de donner directement une réponse.

Apple n'est pas une entreprise axée sur la technologie. Tous leurs services et technologies sont au service des produits, c'est-à-dire qu'ils peuvent vendre plus d'iPhone, d'iPad et de Mac.

Par conséquent, pendant longtemps, l'équipe de conception a son mot à dire et pense que le produit doit être parfait à 100%.

Cette poursuite s'est également poursuivie pour l'équipe d'intelligence artificielle de Siri, mais en tant qu'algorithme, il est impossible d'être précis à 100 % et les erreurs sont inévitables. Ce n'est qu'en faisant des erreurs que nous pouvons mieux optimiser les modèles associés.

Les différentes activités entre eux rendent également le travail de l'équipe d'intelligence artificielle très stressant. À la persuasion de Giannandrea, l'équipe de conception du logiciel a dû ajouter un bouton à Siri, permettant aux utilisateurs de signaler si la réponse était exacte.

Qu'il s'agisse d'insister sur la confidentialité, les problèmes de flux de travail ou de fabriquer un produit 100% parfait, l'équipe d'intelligence artificielle de Siri connaît une série de luttes, tout comme être les mains liées avec de grandes entreprises telles que Google et Amazon. de l'intelligence artificielle.

inconnu

Cet "inconnu" peut en fait faire référence à beaucoup de choses.

L'équipe d'intelligence artificielle d'Apple a introduit de nombreuses améliorations à Siri, telles que Siri X, BlackBird, Pegasus et d'autres projets.

Bien que certains membres du projet soient partis, ces projets sont enfin presque terminés et peuvent être remplacés ou optimisés dans le Siri actuel à tout moment.

Cependant, comme le préconise John Giannandrea, un modèle d'intelligence artificielle est en fait un projet assez compliqué, qui affecte tout le corps.

La modification et le remplacement à l'aveugle peuvent causer des problèmes imprévisibles.

De plus, par rapport à d'autres assistants vocaux comme Alexa d'Amazon ou l'assistant de Google, les réponses de Siri reposent fortement sur l'implication humaine.

En d'autres termes, la base de données de Siri comporte de nombreuses limitations et interventions humaines.Après plus de dix ans de modifications et d'ajustements, la base de données est devenue compliquée et longue.

De plus, il est également différent de la méthode de travail de la base de données du grand modèle de langage LLM actuel.. Il ne peut pas simplement ajouter une interface API pour exécuter ChatGPT en douceur et avoir des fonctions similaires.

Ce qu'Apple doit décider maintenant, c'est s'il veut un Smart Siri, s'il faut le renverser et recommencer, ou l'optimiser couche par couche.

En outre, personne ne nie la rentabilité, les flux de trésorerie et les énormes capacités de mobilisation des ressources d'Apple. De plus, il existe également des ressources matérielles et des réserves de connaissances telles que des puces et des terminaux.

Lorsqu'Apple est déterminé à se consacrer au domaine de l'AIGC, il peut former de grands modèles de langage complexes et créer sa propre IA générative.

Mais Apple doit décider s'il doit "réinventer la roue", ou investir sa vision et ses ressources dans la manière d'appliquer l'AIGC au terminal et de l'intégrer dans l'écologie.

Après tout, les LLM qui prennent en charge des services complexes tels que ChatGPT fonctionnent toujours dans le cloud, et il est encore vide pour les appliquer à l'écosystème du terminal.

En termes de transfert de personnel, Apple se concentre actuellement davantage sur les experts de la reconnaissance visuelle et, toute proportion gardée, sur le domaine propre à la réalité virtuelle XR.

Pour Apple, l'explosion technologique dans l'industrie AIGC a moins d'un an, et comment l'appliquer aux produits Apple est encore une tentative très préliminaire.

Et Apple se prépare depuis de nombreuses années, avec l'intention de remplacer l'iPhone en tant que prochaine grande tendance des équipements de réalité virtuelle XR, c'est peut-être le produit auquel Apple devrait se soucier le plus et se concentrer sur le développement.

Quant à transformer Siri en Smart Siri ou Siri Copilot, laissez l'équipe d'IA dirigée par John Giannandrea gravir la montagne pendant un moment.

#Bienvenue pour prêter attention au compte public WeChat officiel d'Aifaner : Aifaner (WeChat ID : ifanr), un contenu plus excitant vous sera présenté dès que possible.

Ai Faner | Lien d'origine · Voir les commentaires · Sina Weibo