Le grand modèle de Siri d’Apple n’est peut-être pas ce que vous pensez

L’IA d’Apple est en retard mais arrive.

Selon le Wall Street Journal, Apple est en discussion avec Baidu sur l'intégration de l'IA générative dans les iPhones et autres appareils sur le marché intérieur.

Bien qu’il n’y ait pas encore de confirmation officielle, deux choses sont sûres :

  • iPhone 16, iOS 18 et MacOS seront équipés de fonctions IA
  • Les grands modèles sur les appareils Apple seront fournis par différents fabricants nationaux et étrangers

Par rapport aux marques nationales qui ont déjà équipé des assistants IA, Apple a sans surprise plus de six mois de retard cette fois-ci. La lenteur semble avoir toujours été le label d'Apple, mais ils peuvent toujours apporter des surprises tout en avançant régulièrement.

Cependant, la vitesse de progression des grands modèles d'IA se mesure en semaines, voire en jours : l'arrivée tardive d'Apple est-elle encore une fois un retardataire, ou le début d'une nouvelle ère de retard ?

Un plan légèrement compromis, la clé est de monter d'abord dans le bus

Le dernier jour du mois dernier, Apple a annoncé lors d'une courte réunion de 12 minutes qu'elle renoncerait à la construction de voitures et passerait à All in AI. De nombreux membres de l'équipe automobile seraient transférés au département IA.

Le projet Titan, en sommeil depuis dix ans, a échoué au cours de la dernière année d'entrée dans les véhicules à énergies nouvelles. Ce sera un peu regrettable pour le futur marché automobile où s'affronteront une centaine d'écoles de pensée. le développement à long terme d'une entreprise technologique, ce n'est rien d'autre qu'un développement à long terme et le bon choix.

L'IA est une application de base. À l'heure où toutes les grandes entreprises adoptent activement ou passivement l'IA, la « échappée » d'Apple est dans l'air du temps, mais comment adopter l'IA ? Quel type d’intelligence artificielle peut occuper une place sur un marché progressivement divisé ? C'est le premier problème qu'ils doivent résoudre.

Pour les marchés étrangers, Apple négocie activement avec Google pour ajouter de grands modèles d’IA à iOS 18 afin de réaliser des fonctions d’IA que d’autres marques possèdent déjà.

Bien que « les deux parties n'aient pas encore décidé des termes ou de la marque de l'accord sur l'intelligence artificielle, ni finalisé comment le mettre en œuvre », parmi les nombreux partenaires alternatifs (OpenAI et Anthropic), Google et Gemini devraient être les plus appropriés pour Apple et iPhone. .

Les modèles de la série Samsung Galaxy S24 sortis en février de cette année sont hors du commun avec des fonctions d'IA. Des fonctions telles que la traduction d'appels et l'écriture créative ont rattrapé la moyenne nationale. La recherche instantanée a raccourci le chemin de recherche et est très susceptible de devenir le Principale caractéristique des téléphones mobiles IA dans le futur.

La version outre-mer de la série S24 est capable de compléter les fonctions ci-dessus grâce au support du grand modèle Gemini.

Par expérience, Google a terminé ses premières tentatives sur le modèle phare avec le volume d'expédition le plus élevé au monde. Par rapport aux fabricants populaires du côté PC ou Web, ils connaissent les habitudes de fonctionnement, les scénarios d'utilisation et l'adaptation des grands mobiles. modèles de téléphone meilleurs. Que doit faire l'application.

De plus, Google lui-même est plus désireux d'obtenir les projets d'Apple.

Selon les statistiques de la société internationale de données IDC, la part de marché mondiale des smartphones de Samsung a atteint 19,4 % en 2023, tandis qu'Apple a atteint avec succès le sommet de 20,1 %.

S'il gagne Apple, le taux d'adoption de Gemini dans les terminaux de téléphonie mobile dans le monde atteindra 40 %, ce qui est extrêmement bon pour une grande entreprise modèle d'IA confrontée à une concurrence féroce.

Outre Google, Apple s'est également réveillé du rêve.

Contrairement à d'autres fabricants qui mettent l'accent sur « l'auto-recherche », Apple a utilisé la coopération pour réaliser l'intégration de l'IA dès le début, et il avait également ses propres considérations.

Tout d'abord, dans la situation actuelle de démarrage tardif et de progrès lents, la « doctrine d'utilisation » est un bon moyen d'être rapidement compétitif sur le marché. La coopération avec Google peut réduire les coûts de R&D et facturer des frais de fosse élevés, tout en atténuant les relations des deux sociétés. conflits, pressions réglementaires actuelles.

Deuxièmement, la technologie d'AIGC est très bonne, mais lors de sa mise en œuvre, elle a été beaucoup critiquée pour ses lacunes en matière d'éthique, de confidentialité et d'autres aspects. Elle a été confiée à un tiers mature, en particulier Google, qui a testé avec succès l'eau sur Modèles Samsung, économisant des efforts et des soucis. Et réduire l'opinion publique et les risques de responsabilité.

Un autre obstacle est la localisation de la technologie. Chaque pays et chaque région a des exigences différentes en ce qui concerne la surveillance et les lois connexes des grands modèles d'IA. La mise en œuvre du respect de la loi est une condition préalable à la concurrence sur le marché et au développement de la technologie. C'est pourquoi la voie à deux volets « national + international » est née. .

Selon la première coopération fructueuse entre Samsung et Baidu, Apple choisira cette voie qui a été "vérifiée comme étant vraie".

La fonction IA de la version Banque Nationale de la série Samsung S24 est en fait composée de technologies provenant de plusieurs fabricants : la fonction de recherche instantanée est fournie par Baidu et JD.com ; la retouche photo intelligente est complétée par le grand modèle MiracleVision de Meitu Xiuxiu ; le résumé de l'article, intelligent L'écriture adopte le modèle Wenxin Yiyan de Baidu.

Il faudra encore attendre des nouvelles pour savoir si Apple coopérera également avec plusieurs fabricants, mais la coopération avec Baidu est déjà une certitude.

En fin de compte, ce qu’Apple souhaite faire n’est pas un assistant vocal intelligent, mais un ensemble complet de terminaux IA. Cependant, selon les révélations de Macrumor, avec les progrès actuels de l’auto-recherche et les réalisations techniques, les grands modèles d’Apple sont encore loin du niveau d’entreprises comme Google et OpenAI.

Au lieu de se précipiter pour lancer un chatbot intelligent, il est préférable d'utiliser d'abord des solutions matures comme transition afin de gagner plus de temps de recherche et de marge d'amélioration pour les grands modèles auto-développés.

Le marché actuel est important, mais la technologie de base du futur est fondamentale

La coopération est la première étape dans la mondialisation de l'IA d'Apple, et l'objectif ultime est de disposer d'un grand modèle d'IA auto-développé.

C'est un projet qui consomme de l'argent et de l'énergie, sans parler de la régression, si vous avancez un peu plus lentement, vous risquez d'être éliminé la semaine prochaine. Un modèle vaste et compétitif représente souvent une domination future et un pouvoir de négociation sur le marché.

Cook pense :

Innovante en matière d’IA générative, nous pensons que cette technologie peut redéfinir l’avenir.

L’exploration par Apple des grands modèles a en fait toujours été à l’ordre du jour.

Le 15 de ce mois, les ingénieurs d'Apple ont discrètement publié un document de recherche détaillant le processus de développement d'un nouveau modèle d'IA générative appelé MM1.

MM1 est une série LLM multimodale comportant jusqu’à 30 milliards de paramètres, ce qui constitue le dernier résultat de recherche d’Apple sur les grands modèles multimodaux.

En général, le modèle développé par Apple est toujours en retard sur Gemini et GPT4V en termes de résultats de tests. Il ne montre pas de résultats aussi étonnants que Sora dans la génération de résultats, ni n'explore une nouvelle voie technique.

Cependant, il peut contrôler diverses variables de données et découvrir par comparaison les facteurs les plus critiques qui affectent l'effet de génération du modèle. Pour le dire simplement, il n'est pas intrinsèquement puissant, mais il est bon en observation, en pratique et en synthèse. Après des tentatives répétées, , peut également obtenir de bons résultats.

MM1 est composé de modèles denses et de variantes MoE (Mixed Expert).Lorsque l'instruction entre dans le MoE, si vous devez vous rendre au marché de l'Est pour acheter un cheval ou au marché de l'Ouest pour acheter une selle sera clairement déterminé par ce centre de commandement.

Tandis que les problèmes sont affinés et classés, l'efficacité informatique est également améliorée et la consommation d'énergie de fonctionnement est économisée.

La publication de cet article représente les résultats par étapes de l'exploration d'Apple dans le domaine de l'IA. Bien que MM1 n'ait pas bouleversé l'industrie ni étonné le monde, leurs progrès peuvent encore être observés en termes professionnels obscurs :

Notre modèle de travail a toujours été de faire le travail d’abord et d’en parler plus tard, plutôt que d’être impoli devant nous-mêmes. ——Tim Cook

Apple, qui n'a pas divulgué trop de détails techniques, envisage en fait encore une autre démarche : un grand modèle côté terminal.

Dès la fin de l'année dernière, Apple a proposé une méthode pour implémenter de grands modèles dans des appareils « à mémoire limitée » tels que l'iPhone dans un article intitulé « Large-scale Language Models in Flash Memory: Efficient Large-Scale Language Model Inference under Mémoire limitée."

Les chercheurs affirment avoir déployé avec succès le LLM (Large Language Model) sur des iPhones et autres appareils à mémoire limitée en utilisant la dernière technologie de mémoire flash.

Ce projet s'appelle Apple GPT. Sa fonction principale est de stocker les données LLM directement dans la mémoire flash, par exemple en les intégrant dans Siri. Par rapport à la méthode d'exécution traditionnelle, la nouvelle technologie augmente la vitesse d'inférence du CPU et du GPU jusqu'à 5. fois et 25 fois.

"Les méthodes d'efficacité que nous avons développées permettent aux modèles d'IA de fonctionner dans une plage de mémoire deux fois supérieure à celle de l'iPhone", ont déclaré les chercheurs.

En d'autres termes, il est possible de transporter de grands modèles sur le côté. En réduisant la quantité de données transmises par la mémoire flash et en améliorant le débit de chaque transmission, les données LLM peuvent être stockées directement dans la mémoire flash.

La technologie mise à part, Siri est le pont entre nous et l'IA

Les progrès sont lents, les nouvelles sont peu nombreuses et la mise en page est vaste. Ceci est un aperçu de l’exploration de l’IA par Apple.

Chaque fois que nous constatons qu'une certaine technologie Apple est à la traîne par rapport au marché et à ses concurrents, cela donne aux gens l'illusion qu'elle a « commencé trop tard ». En fait, en parcourant les actualités et les documents de brevet pertinents, vous constaterez qu'il s'agit souvent du premier à déployer, ce lot, même celui-là.

En 2023, Apple a acquis un total de 32 sociétés d’IA, se classant ainsi au premier rang des géants de la technologie en termes d’acquisitions. L'acquisition de Siri doit être considérée comme le début de l'entrée d'Apple dans l'IA.

En 2010, Jobs a téléphoné à Dag Kittlaus, le « père de Siri », ce qui a conduit Siri à rejoindre Apple et à lancer l'iPhone d'une valeur de plus de 200 millions de dollars américains.

Siri se positionnait à l’origine comme un assistant permettant d’obtenir des informations de manière rapide et précise, ou de gérer des tâches complexes.

Dans sa version la plus primitive, Siri peut se connecter à 42 services réseau – du site Web de critiques de restaurants Yelp et du site Web de vente de billets StubHub au site Web de critiques de films Rotten Tomatoes et au site de calcul mathématique Wolfram Alpha.

Sur la base des invites, Siri intégrera diverses informations et répondra à l'utilisateur. Siri peut aider les utilisateurs à acheter des billets, à réserver un restaurant ou à appeler un taxi sans ouvrir une autre application.

Ces « fonctions d'IA » qui sont désormais vigoureusement promues par AI Pin et d'autres assistants intelligents semblent n'être que les « opérations de base » de Siri il y a plus de dix ans.

Cependant, l’expérience réelle de Siri a été grandement divisée par le développement explosif de grands modèles d’IA.

Les assistants intelligents sont des imitations passives des personnes, répondant à toutes les questions et répondant aux demandes.

Le terminal IA est une approche active des personnes. Sur la base des habitudes et préférences personnelles de l'utilisateur, après avoir résumé le passé et le raisonnement, nous vous donnerons les suggestions et les réponses les plus appropriées à différents moments et lieux, et nous pourrons continuellement apprendre et optimiser pour devenir « privé et exclusif ».

▲ Photo de : x.com

Dans l'ensemble, le retard d'Apple n'est que relativement tardif, car les téléphones mobiles IA en sont encore aux premiers stades de développement.

En effet, la plupart des marques nationales ont déjà fait des efforts au niveau des terminaux IA, avec à peu près les mêmes fonctions et spécialités différentes. Cependant, la convivialité de chaque grand modèle ne peut être considérée que comme passagère, à l'exception de l'élimination par l'IA des albums photo OPPO et des véritables -Traitement des appels en temps réel de Samsung. Pour les fonctions segmentées telles que la traduction et les appels IA de Xiao Ai, la plupart de l'expérience est encore quelque peu différente de celle des applications IA indépendantes.

Outre les avancées technologiques des fabricants, cela est également lié à l'interface ouverte de l'application. Par exemple, les modèles qui ne prennent pas en charge le résumé des appels vocaux WeChat perdront une grande partie de l'espace d'application dans la vie quotidienne.

Par conséquent, l’intégration de grands modèles, systèmes et applications, ainsi que l’exploration de nouvelles méthodes d’interaction, ont encore un long chemin à parcourir. Avant cela, les fonctions de l’IA n’avaient pas encore atteint le niveau nécessaire pour influencer les décisions d’achat des consommateurs.

Au cours de la première année du lancement de l'IA, l'objectif de Siri est de combler l'écart de plus de six mois avec les autres assistants IA ; et en tant que partie importante de la future configuration d'Apple, nous attendons encore plus avec impatience quel genre de « Encore une chose » " Siri amènera en juin. ".

# Bienvenue pour suivre le compte public officiel WeChat d'aifaner : aifaner (ID WeChat : ifanr). Un contenu plus passionnant vous sera fourni dès que possible.

Ai Faner | Lien original · Voir les commentaires · Sina Weibo