Heureusement, l’IA nationale d’Apple n’a pas choisi DeepSeek

Lorsque tout le monde se demande où l’IA nationale d’Apple fera son prochain pas, la réponse est à la fois surprenante et raisonnable. Pas le plus vivant, ni le plus bruyant, ni celui avec la plus forte opposition, mais le plus discret – Ali.

Selon le média étranger The Information, Apple aurait finalement choisi Alibaba comme partenaire pour la version chinoise de l'IA.

Dans l’article publié hier soir, nous avons également remarqué la polarisation des attitudes des internautes dans la zone des commentaires. Certaines personnes pensent qu'Alibaba est le meilleur candidat et qu'il est bien mérité, tandis que d'autres sont perplexes quant au fait qu'Apple ait contourné DeepSeek et choisi Alibaba.

Mais si vous regardez l’ensemble du processus de sélection, il n’est peut-être pas injuste que DeepSeek soit abandonné par Apple.

Quel est le niveau du modèle Ali Qwen ?

Parmi les nombreuses grandes sociétés d’IA, Alibaba est probablement la plus secrète.

Souvent, ce n'est pas nécessairement un inconvénient. Dans le secteur de l'IA en constante évolution, parfois "pas assez sexy" est le plus grand avantage, car l'autre côté signifie souvent être terre-à-terre.

Du point de vue de la dimension fondamentale de la force technique, la communauté open source est comme un miroir qui peut refléter la véritable force technique. Alibaba est l’un des rares fabricants nationaux à pouvoir tenir bon devant ce miroir.

Cela peut être vu dans la dernière liste de grands modèles open source de Hugging Face, la plus grande communauté open source d'IA au monde. Les dix principaux grands modèles open source sont tous des modèles dérivés basés sur la formation secondaire du modèle open source Qwen d'Alibaba.

Cette liste est actuellement la liste de grands modèles open source la plus fiable au monde. Ses dimensions de test couvrent la compréhension écrite, le raisonnement logique, les calculs mathématiques, les questions et réponses basées sur des faits, etc.

Un autre fait incontestable est que la valeur de la création d’une marque technologique ne cesse d’augmenter. Le grand modèle Qwen, acclamé et populaire, a surpassé Llama et est devenu le modèle de base de référence reconnu par la communauté open source.

En tant que premier grand modèle open source du secteur à réaliser des scénarios « pleine taille, mode complet et multiples », le modèle Alibaba Cloud Qwen offre aux développeurs et aux entreprises des tailles et des versions allant de 1,5 Go à 72 Go et même 110 Go, répondant pleinement aux besoins des différents scénarios d'application.

Parmi eux, les modèles de compréhension visuelle Qwen-VL et Qwen2-VL ont à eux seuls été téléchargés plus de 32 millions de fois dans le monde. Il y a une semaine, Qwen2.5-VL a inauguré une nouvelle mise à jour, qui a une fois de plus enflammé l'enthousiasme de la communauté open source.

Les données parlent d'elles-mêmes. Dans la liste des modèles open source 2024 de Hugging Face, Qwen2.5-1.5B-Instruct est devenu le modèle open source le plus populaire parmi les développeurs mondiaux avec une part de téléchargement de 26,6 %.

Actuellement, le nombre de modèles dérivés de Qwen dépasse les 90 000, ce qui en fait le plus grand groupe de modèles open source au monde.

Dans la vague technologique des modèles d’inférence, Qwen a démontré un puissant champ gravitationnel. Récemment, le modèle d'inférence s1 formé par l'équipe de Li Feifei, connu sous le nom de « Marraine de l'IA », a utilisé moins de ressources et de données, qui est également basé sur le modèle de distillation Qwen-32B, et a obtenu les résultats de l'analyse comparative d'OpenAI o1-Preview dans plusieurs capacités.

Ces réalisations sont toutes dues à l'excellente solidité de base du modèle Qwen, mais c'est également cette solidité qui donne à Alibaba la confiance nécessaire pour accepter les exigences élevées d'Apple en matière de fonctions d'IA.

En outre, par rapport à d'autres start-ups de l'IA, les avantages d'Alibaba en tant que géant chinois de l'IA sont évidents. Elle est plus familiarisée avec les besoins des utilisateurs nationaux et a une meilleure compréhension des politiques de conformité des données. Celles-ci offrent des garanties importantes pour l'adaptation locale et la mise en œuvre rapide des fonctions d'IA d'Apple.

Bien sûr, même si Ali a finalement gagné, ce résultat n'était pas prévu dès le début. Au cours des derniers mois, Apple a mené plusieurs séries d'inspections auprès d'un certain nombre de sociétés candidates, notamment Tencent, ByteDance et DeepSeek.

Lors d'un récent appel aux résultats, le PDG d'Apple, Tim Cook, a fait l'éloge de DeepSeek.

Cook a souligné que DeepSeek a réalisé une innovation significative en réduisant les coûts de formation et de fonctionnement du modèle V3. Il a souligné que l’innovation qui favorise l’efficacité est une chose très positive, comme l’a démontré DeepSeek.

Cependant, en raison du manque de taille de l'équipe et d'une grande expérience du service client, il n'est pas surprenant que DeepSeek soit hors du jeu. Cela se reflète dans le message « le serveur est occupé, veuillez réessayer plus tard ». En revanche, le châssis technique et l'infrastructure d'Alibaba Cloud offrent à Apple des avantages plus importants en termes de prise en charge localisée de la puissance de calcul.

Plus important encore, en coopérant avec Alibaba, Apple espère lancer des fonctions d'IA (telles que la voix intelligente, la compréhension visuelle, etc.) qui correspondent aux habitudes des utilisateurs chinois, améliorer la compétitivité des produits et inverser le déclin du marché.

Selon certaines informations, Apple, qui a des objectifs clairs, espère trouver un partenaire capable de comprendre les besoins des utilisateurs chinois sur la base des données personnelles des utilisateurs, qui constituent également un élément important de la construction des téléphones intelligents Apple.

Lorsque Apple a évalué les modèles d'IA développés par plusieurs sociétés chinoises, elle n'était pas satisfaite de la capacité des modèles à comprendre l'intention de l'utilisateur et à intégrer l'utilisation réelle du téléphone par l'utilisateur dans les réponses générées.

Qu'il puisse résister à l'examen minutieux d'un regard critique et à l'épreuve de scénarios difficiles, le choix d'Apple d'Alibaba pour son IA nationale peut être la meilleure réponse à cette question, et c'est aussi la meilleure certification de la force de Qwen.

Une fois Qwen utilisé sur iPhone, ces expériences seront remodelées

Alors que l'industrie de la téléphonie mobile inaugure une nouvelle série de changements technologiques, Liu Zuohu, directeur des produits d'OPPO, a formulé un jugement important lors de la conférence stratégique sur l'IA d'OPPO l'année dernière : « Les téléphones mobiles IA seront la troisième étape majeure du changement dans l'industrie de la téléphonie mobile après les téléphones multifonctions et les smartphones.

Le développement des téléphones mobiles IA est décrit en trois étapes : la première est l'IA au niveau de l'application, qui rend les applications individuelles plus intelligentes ; la seconde est l'IA au niveau du système, qui intègre les capacités de l'IA au niveau du système d'exploitation et atteint finalement le stade de « l'IA est le système », faisant de l'IA le cœur de l'interaction avec les téléphones mobiles ;

Compte tenu de la récente popularité de Deepseek, la forme d'application de l'IA dans le domaine de la téléphonie mobile est devenue de plus en plus claire. Les fabricants de téléphones mobiles adoptent généralement la solution de « collaboration appareil-cloud » : les tâches légères sont traitées localement sur le téléphone mobile et les tâches complexes sont transférées vers le cloud.

Apple Smart a également démontré une architecture en couches similaire après la conférence WWDC de l'année dernière :

  • Modèle local : principalement un petit modèle 3B affiné, dédié à des tâches telles que la synthèse et le polissage. Avec le support de l'adaptateur, ses capacités ne sont pas faibles.
  • Cloud computing privé : si le modèle local ne peut pas répondre aux exigences, il sera transféré vers le cloud pour le calcul. Apple garantit un cryptage de bout en bout pour protéger la sécurité et la confidentialité des données des utilisateurs
  • LLM tiers : utilisé pour les discussions de questions et réponses à usage général. Des applications telles que Siri sont connectées à des modèles externes tels que ChatGPT.

Si rien d'inattendu ne se produit, dans le cadre de la dernière coopération avec Alibaba, le modèle Qwen sera probablement intégré à l'écosystème iPhone sous deux formes. L'une est essentiellement une forme de plug-in, fournissant des services d'IA complets en tant que LLM tiers.

Cette stratégie est cohérente avec l’approche d’Apple visant à intégrer ChatGPT sur les marchés étrangers. Mais tout comme sa coopération avec OpenAI n'est pas exclusive et que des modèles tels que Google Gemini ou Claude pourraient être intégrés dans les iPhones étrangers à l'avenir, davantage de modèles d'IA produits dans le pays pourraient également être introduits sur le marché intérieur.

La seconde consiste à coopérer avec Alibaba pour déployer et développer une version distillée du petit modèle. Contrairement à DeepSeek V3/R1, qui se concentre sur le modèle ultra-large 671B, Qwen adopte une approche globale. Même la célèbre société DeepSeek a choisi de construire 4 de ses 6 petits modèles de distillation open source basés sur Qwen, ce qui en soi est la meilleure preuve de la force technique d'Alibaba.

En guise de digression, bien que Deepseek ait publié Janus-Pro-7B, un modèle multimodal qui surpasse OpenAI DALL·E 3, DeepSeek ne prend actuellement pas en charge les capacités multimodales du côté C. Et Qwen est vraiment bon quand d’autres ne l’ont pas, et ce n’est pas mal quand d’autres l’ont. Le nouveau Qwen 2.5 Max fait également partie des modèles multimodaux de haut niveau les plus compétitifs.

Il convient de noter qu’il existe également des avancées dans la technologie de compression de modèles. En 2024, les fabricants chinois ont réalisé des progrès significatifs dans l’optimisation des modèles d’IA, en utilisant les dernières technologies de quantification et d’élagage pour rationaliser considérablement l’échelle des paramètres tout en garantissant la qualité des résultats.

Par exemple, selon Canalys, le MiLM2 de Xiaomi a réduit ses paramètres de modèle de 6 milliards à 4 milliards, tandis que Honor et Vivo ont également réduit leurs paramètres de modèle des 7 milliards précédents à 3 milliards respectivement. Tongyi Qianwen utilise également l'élagage structuré pour compresser le modèle de paramètres 7B à 2,2B, tout en conservant des capacités de compréhension et de génération considérables.

Au niveau des outils, Core ML Tools d'Apple prend également en charge la quantification des poids du modèle, ce qui peut réduire la précision float 32 par défaut à float 16, 8 bits, 7 bits ou même 1 bit. Cela réduit non seulement considérablement l'espace de stockage et la consommation de ressources informatiques du modèle, mais améliore également la stabilité du processus d'inférence et la fiabilité des résultats.

Le processus de quantification ne modifie pas la précision des tenseurs intermédiaires, qui sont généralement maintenus à une précision flottante 32 ou flottante 16, et les poids sont déquantifiés au moment de l'exécution pour correspondre à la précision des tenseurs intermédiaires, améliorant ainsi la précision des résultats d'inférence.

Dès l'année dernière, grâce à une série de technologies d'optimisation, notamment la planéisation des bits faibles, la quantification d'activation, la quantification intégrée, la mise à jour efficace du cache KV et l'utilisation des outils Talaria pour l'analyse de la latence et de la consommation d'énergie, le modèle 3B d'Apple fonctionnant sur l'iPhone 15 Pro a atteint un retard de seulement 0,6 milliseconde pour le premier jeton et pouvait générer 30 jetons par seconde, créant ainsi une expérience fluide.

Bien entendu, l’objectif ultime de l’intelligence Apple est de créer un véritable assistant IA au niveau du système.

Les petits modèles sont la solution, et l'écologie est l'atout ultime. L'écosystème d'Alibaba couvre le commerce électronique, le paiement, les services locaux et le divertissement. Après une coopération approfondie avec iPhone AI, les utilisateurs pourront à l'avenir compléter de manière transparente l'ensemble du processus de réservation de services grâce à de simples commandes vocales. Il est même prévu d'exploiter les ressources d'entreprises telles que DingTalk pour élargir davantage les scénarios d'application.

La concurrence entre les téléphones mobiles IA passe d’une pure compétition technique à une compétition d’intégration écologique et d’expérience utilisateur. Les fabricants doivent travailler ensemble dans les trois dimensions de la puissance de calcul locale, des capacités du cloud et de la synergie écologique pour créer des téléphones IA qui impressionnent véritablement les utilisateurs.

À en juger par la réaction du marché, cette coopération a largement dépassé les attentes. Qu'il s'agisse de la popularité de DeepSeek ou du « mariage » entre Apple et Alibaba, cette phrase est en effet fidèle : un vrai maître est comme une rivière qui coule vers l'est, apparemment calme et silencieuse, mais cachant un grand pouvoir.

# Bienvenue pour suivre le compte public officiel WeChat d'Aifaner : Aifaner (ID WeChat : ifanr). Un contenu plus passionnant vous sera fourni dès que possible.

Ai Faner | Lien original · Voir les commentaires · Sina Weibo