Le Core Ultra de première génération d’Intel est officiellement lancé, établissant une base pour les PC IA et capable d’exécuter de grands modèles d’IA sans réseau

15 décembre 2023 Hibou Gourou

Lorsque nous utilisons des outils d'IA pris en charge par de grands modèles de langage tels que ChatGPT, Wenxinyiyan et Tongyi Qianwen, il y a une condition nécessaire : Internet doit être connecté.

Parce que le calcul des outils d’IA se fait dans le cloud, et non localement sur l’ordinateur. Cependant, du point de vue des fabricants de puces et de terminaux en amont, les grands modèles dans un environnement en réseau sont puissants, mais ils doivent également être complétés par de grands modèles d'extrémité pouvant fonctionner sans réseau. solution parfaite.

Ainsi, lors de l'événement de lancement officiel du Core Ultra de première génération d'Intel le 15 décembre, nous avons constaté que le grand modèle d'Alibaba Cloud Tongyi Qianwen avait été adapté avec succès à la plate-forme Intel Core Ultra et pouvait être déployé sur des PC et d'autres appareils à l'avenir.

Grâce à la plate-forme Core Ultra de première génération (nom de code Meteor Lake), il présente le changement d'architecture de processeur le plus important d'Intel depuis 40 ans, à savoir une architecture de modules séparés et la première unité de traitement de réseau neuronal (NPU) intégrée, déployée sur Intel Core. Appareils ultra-plateformes Le grand modèle Tongyi Qianwen sur Internet peut réduire considérablement le temps de réponse d'inférence du modèle, avec une accélération moyenne allant jusqu'à 3 fois.

De plus, Intel a également testé précédemment les bonnes performances du grand modèle LLaMa2-7B de Meta en fonctionnement sans réseau côté appareil. Le concept d'AI PC est devenu clair grâce à la mise en œuvre progressive du grand modèle côté appareil .

Depuis la sortie de ChatGPT à la fin de l'année dernière, les applications AIGC prises en charge par la technologie des grands modèles de langage ont connu un grand développement. La position principale de cette vague d'IA est sur PC, car le PC est plus adapté à la plupart des utilisateurs en termes d'interaction et de présentation. Les applications AIGC, qu'il s'agisse de ChatGPT ou de MidJourney, doivent être connectées à Internet. Une fois qu'il n'y aura plus de réseau, nous serons déconnectés de l'IA.

Par conséquent, si un PC veut véritablement évoluer vers un PC IA, non seulement les applications AIGC peuvent y être facilement exécutées, mais il doit également disposer de puissantes capacités de traitement IA.

Par conséquent, la nouvelle selon laquelle le grand modèle Qwen-7B d'Alibaba Cloud Tongyi Qianwen s'est adapté avec succès à la plate-forme Intel Core Ultra et pourra être déployé sur des PC et d'autres terminaux à l'avenir a deux significations et une signification symbolique.

Le premier niveau de sens est : sur quoi Intel s'appuie-t-il lorsqu'il crie le slogan AI PC ?

Lors de la conférence sur l'innovation technologique qui s'est tenue dans la Silicon Valley en septembre de cette année, le PDG d'Intel, Pat Gelsinger, a proposé le concept révolutionnaire du PC-AI PC.

Si vous souhaitez effectuer efficacement des calculs d'IA et exécuter des applications d'IA sur un PC, l'architecture traditionnelle CPU+GPU n'est pas la solution optimale. Par conséquent, sur la plate-forme Core Ultra de première génération, Intel a adopté de manière innovante une architecture de modules séparés, qui est également l'histoire d'Intel Le plus grand changement structurel de processeur au monde, le processeur sera composé de quatre modules indépendants : module informatique, module SoC, module graphique et module IO, et sera connecté via la technologie de packaging 3D Foveros :

Module de calcul (Compute Tile) : adopte la dernière génération de microarchitecture de base d'efficacité énergétique et de performance et de fonctions améliorées. Ce module utilise la technologie de processus Intel 4 de nouvelle génération et a réalisé des progrès significatifs en termes de taux de consommation d'énergie.

Module SoC (SoC Tile) : la conception innovante d'îlot à faible consommation (Low Power Island) intègre une unité de traitement de réseau neuronal (NPU), apportant des performances de fonction IA économes en énergie au PC et est compatible avec les interfaces de programme standardisées telles que OpenVINO. le développement et la vulgarisation d’applications d’IA. Le nouveau noyau à faible consommation d'énergie optimise encore davantage l'équilibre entre économie d'énergie et performances. Le module SoC intègre également un contrôleur de mémoire, un traitement de codec multimédia et une unité d'affichage, prenant en charge les codecs 8K HDR et AV1 ainsi que les normes HDMI 2.1 et Display Port 2.1. Le Wi-Fi et le Bluetooth sont également pris en charge, y compris le Wi-Fi 6E.

Module graphique (GPU Tile) : ce processeur intègre l'architecture graphique Intel Sharp, qui peut fournir des performances indépendantes au niveau de la carte graphique dans la carte graphique intégrée et prend en charge le lancer de rayons et Intel XeSS. Avec une augmentation des capacités graphiques et une efficacité énergétique améliorée, Meteor Lake offre des performances par watt exceptionnelles.

Module IO (IO Tile) : contient une connectivité supérieure, intégrant Thunderbolt 4 et PCIe Gen 5.0.

Prenant comme exemple le processeur Core Ultra 7 165H (TDP 28W), Intel a déclaré que ses performances multithread sont plus de trois fois supérieures à celles de Qualcomm Snapdragon 8cx Gen 3 et 1,11 fois supérieures à celles de son concurrent direct AMD 7840U.

Dans le même temps, Intel a déclaré qu'avec de meilleures performances multithread, l'efficacité énergétique du Core Ultra 7 165H dans divers scénarios est également meilleure que celle de l'AMD 7840U.

De plus, l'îlot basse consommation est une conception très intéressante. Il dispose de 2 cœurs LPE-Cores ultra basse consommation, qui peuvent exécuter des tâches qui ne nécessitent pas de vitesse de réponse, comme la lecture en ligne, etc., réduisant encore davantage la consommation d'énergie. . Ce qui rend cette conception intéressante, c'est que ces deux cœurs à très faible consommation sont situés dans le module SoC, et non dans le module de calcul.

Bien sûr, la mise à jour la plus importante et la plus significative est que le nouveau module NPU sera principalement responsable du calcul de l'IA. Parce qu'il s'agit d'une unité de calcul spéciale pour l'accélération de l'intelligence artificielle, l'avantage des modèles NPU dans le calcul de l'IA est la haute performance et la faible consommation d'énergie. . , De plus, les processeurs à faible latence et à haute réponse et les GPU hautes performances et à haut débit supporteront également la demande de puissance de calcul de l'IA. La coopération des trois forme une puissante puissance de calcul de l'IA sur le terminal.

Toujours par rapport au processeur AMD 7840U voisin, Intel a déclaré que la puissance de calcul globale de l'IA du Core Ultra 7 165H bat non seulement son produit de génération précédente, le Core i7-1370P, mais écrase également l'AMD 7840U.

Pour donner un exemple d'application pratique, Jianying, l'outil de montage vidéo d'Intel et de ByteDance, a travaillé ensemble pour optimiser la fonction « smart keying » que les utilisateurs utilisent fréquemment, et a transféré les exigences informatiques de cette fonction vers les produits Core Ultra de première génération. Après NPU, nous avons constaté que le traitement du matériel vidéo prend non seulement moins de temps, mais réduit également la consommation d'énergie. À l'heure actuelle, la puissance de calcul gratuite du CPU et du GPU peut être utilisée pour d'autres besoins d'édition.

Par conséquent, ce qu’on appelle le PC AI peut non seulement mieux exécuter les fonctions d’IA, mais également améliorer l’efficacité et réduire la consommation d’énergie.

Le deuxième sens est : que peut faire un grand modèle comme Tongyi Qianwen ?

Nous pouvons désormais effectuer une variété d'opérations d'IA sur PC, y compris, mais sans s'y limiter, Wenshengwen, Wenshengtu, Wenshengmusic, ainsi que la découpe de l'IA, la reconnaissance des gestes, la capture de mouvement et, plus en détail, le doublage et le changement de voix par l'IA, ainsi que la vidéoconférence. Correction des yeux, etc.

Certaines d'entre elles sont de toutes nouvelles expériences basées sur de grands modèles de langage, et d'autres sont implémentées sur PC depuis longtemps. Par exemple, le Core de 10e génération a été le premier à introduire la prise en charge des performances de l'IA, qui peut apporter une amélioration automatique de l'image et de la vidéo. amélioration de la résolution des PC. , réduction intelligente du bruit et autres fonctions d'IA.

La technologie des grands modèles de langage est considérée comme la voie vers l'intelligence artificielle générale (AGI, Artificial General Intelligence). L'AGI fait référence à un système d'intelligence artificielle doté d'un large éventail de niveaux d'intelligence et de capacités similaires à celles des humains. En comparaison, les grands modèles de langage actuels sont les plus Les systèmes d’IA se concentrent sur une tâche ou un domaine spécifique.

Sur cette base, le nouveau modèle open source Tongyi Qianwen à 72 milliards de paramètres (Qwen-72B) d'Alibaba Cloud peut être considéré comme le grand modèle open source le plus puissant à l'heure actuelle. Qwen-72B a obtenu les meilleurs résultats parmi les modèles open source dans 10 évaluations de référence faisant autorité. Les performances dépassent le benchmark open source Llama 2-70B et la plupart des modèles commerciaux fermés, et il possède déjà certaines capacités générales.

Basé sur les quatre grands modèles de langage open source Qwen-72B, Qwen-14B, Qwen-7B et Qwen-1.8B d'Alibaba Cloud, ainsi que sur le grand modèle de compréhension visuelle Qwen-VL et le grand modèle de compréhension audio Qwen-Audio, Alibaba Le cloud a atteint l'open source « pleine taille, pleine modalité ».

Cela signifie que pour les développeurs de tous horizons, ces grands modèles open source peuvent choisir parmi une variété de packages, notamment des PC, des téléphones mobiles et même des appareils IoT qui ne sont pas familiers avec les appareils.

Le grand modèle de Tongyi Qianwen est déployé sur la plate-forme Intel Core Ultra, et c'est l'une des possibilités qu'il puisse être déployé sur des terminaux tels que les PC à l'avenir.

En outre, l'équipe XD Lab de l'Université des sciences et technologies de Chine orientale a développé un certain nombre de grands modèles industriels basés sur les modèles open source Tongyi Qianwen Qwen-7B et Qwen-14B, y compris le grand modèle de santé mentale MindChat (Man Tan) , le grand modèle de santé médicale Sunsimiao (Sun Simiao) et le modèle éducatif /Exam grand modèle GradChat (Koi), etc.

L'Université du Zhejiang et Higher Education Press ont développé le modèle vertical d'éducation Zhihai-Sanle basé sur Qwen-7B. Il a été appliqué dans 12 universités à travers le pays et peut fournir des questions et réponses intelligentes, la génération de questions de test, la navigation dans l'apprentissage, l'évaluation de l'enseignement et d'autres capacités. Le modèle a été utilisé par Alibaba. La plateforme Yunlingji fournit des services externes, qui peuvent être appelés avec une seule ligne de code.

Rompant avec le monde des bits, dans le monde réel, Zhejiang Youlu Robot Technology Co., Ltd. a intégré Qwen-7B dans le robot de nettoyage des routes, permettant au robot d'interagir avec les utilisateurs en temps réel en langage naturel, de comprendre les besoins mis en place. transmis par les utilisateurs et exécuter les instructions de haut niveau de l'utilisateur.Analyser et démonter, effectuer une analyse logique de haut niveau et une planification des tâches, et effectuer des tâches de nettoyage.

En bref, l’étape de l’IA ne concerne pas seulement les PC, et les PC ne concernent pas seulement les applications d’IA, mais ils commencent à avoir d’énormes intersections, créant des scénarios qui changeront nos habitudes d’utilisation des PC.

Lorsque vous dessinez, devez-vous utiliser une tablette numérique et un stylet sensible à la pression pour créer, ou devez-vous utiliser un dessin vincentien ?

Lorsque vous écrivez, utilisez-vous un clavier pour taper les mots un par un, ou utilisez-vous le chinois pour écrire ?

Ces problèmes sont déjà apparus et chaque utilisateur disposant d’un PC IA sera progressivement confronté à des changements dans ses choix et ses habitudes d’utilisation.

Liu Xuewen

Dans la serre en plastique du destin, chaque chou qui a été aspergé de trop de pesticides rêvait autrefois de devenir un légume biologique sans pollution.

Envoyer un e-mail à Sina Weibo 1

# Bienvenue pour suivre le compte public officiel WeChat d'aifaner : aifaner (ID WeChat : ifanr). Un contenu plus passionnant vous sera fourni dès que possible.

Ai Faner | Lien original · Voir les commentaires · Sina Weibo