Nvidia RTX 4080 : Ce que nous avons appris de GTC 2022

23 mars 2022 Hibou Gourou

Le PDG de Nvidia, Jensen Huang, vient de terminer son premier discours d'ouverture GTC de 2022, et pendant celui-ci, l'exécutif a annoncé l'architecture Hopper de nouvelle génération de Nvidia. Il est lancé dans le H100, un GPU puissant limité à une utilisation dans les centres de données, mais l'annonce contient également quelques indices pour le RTX 4080 et les cartes graphiques grand public de nouvelle génération de Nvidia.

Nvidia n'a pas parlé du RTX 4080 à GTC, et il n'utilisera pas l'architecture Hopper, du moins sur la base de rumeurs. Il y a quelques années, avant le lancement des cartes graphiques de la série RTX 30, des rumeurs suggéraient que Nvidia utiliserait l'architecture Hopper pour ses cartes graphiques de la série RTX 40. Maintenant, il semble que Nvidia sortira deux générations en 2022 : Hopper pour le centre de données et Ada Lovelace pour les consommateurs. Mais cela ne signifie pas que nous ne pouvons pas glaner des informations à partir des annonces.

Architectures doubles

Ce n'est que la deuxième fois que Nvidia sépare ses produits grand public et de centre de données. Entre Pascal et Turing, Nvidia a introduit l'architecture Volta pour les centres de données. C'était un peu un palliatif, permettant à Nvidia de passer à un petit processus de fabrication sur ses produits de centre de données en préparation de la prochaine génération de produits grand public.

Cela a changé avec la série RTX 30, où Nvidia a unifié ses deux gammes de produits sous l'architecture Ampere. Tout cela pour dire qu'il n'y a pas beaucoup de précédents pour ce que fait Nvidia ici. C'est la première fois que nous voyons vraiment deux architectures de Nvidia vivre côte à côte.

Pour Hopper, nous avons appris qu'il utilisera le processus de fabrication N4 de TSMC et que Nvidia vise l'efficacité. Ce qui est intéressant, c'est que Nvidia utiliserait le processus N5 de TSMC pour le 4080, et non le processus plus petit et plus efficace utilisé par les GPU Hopper.

N5 et N4 vivent dans la même famille, mais N4 est légèrement plus efficace que N5. Sur la base des rumeurs que nous avons vues sur les énormes besoins en énergie des cartes graphiques de la série RTX 40, N5 semble plus probable pour la gamme grand public. Cela s'appuie sur la suggestion des leakers selon laquelle le RTX 4080 aura de gros problèmes d'efficacité .

Nous pourrions assister à une répétition de la situation Pascal/Volta/Turing. Nvidia semble être en tête avec Hopper, avec une architecture plus efficace, afin de mettre en place la génération après le RTX 4080. Il est possible que nous passions à un processus plus petit d'ici là, mais il semble que les cartes grand public seront toujours à la traîne par rapport aux données. ceux du centre.

Le processus de fabrication est le développement le plus important, mais Hopper détient également quelques autres indices.

Interconnexion NVLink

Nvidia s'est concentré sur l'évolutivité avec la quatrième génération de NVLink. Il s'agit d'une interconnexion qui n'est pertinente aujourd'hui que dans le centre de données de Nvidia, mais Huang a annoncé qu'elle arriverait aux clients et partenaires.

NVLink étant ouvert, Nvidia affirme que l'objectif est de faire en sorte que d'autres entreprises conçoivent des puces semi-personnalisées qui fonctionnent avec les produits Nvidia. Cela pourrait être pertinent pour les prochaines cartes graphiques grand public de Nvidia. Les rumeurs suggèrent qu'AMD propose une conception de module multipuce (MCM) pour les cartes graphiques RX 7000 , combinant essentiellement plusieurs clusters de calcul séparés sur une seule puce.

L'ouverture de NVLink pourrait jeter les bases pour que Nvidia fasse quelque chose de similaire. Les rumeurs suggèrent qu'AMD va, pour la première fois, dépasser Nvidia avec ses cartes graphiques RX 7000, et cela pourrait être dû à la conception MCM. Il n'est pas clair si le RTX 4080 utilisera une conception MCM, mais le lancement de Hopper suggère que ce ne sera pas le cas.

Le dernier indice vient du H100 CNX, qui est une version du GPU H100 couplé à un Nvidia ConnectX-7 SmartNIC. Cela permet de réduire la latence et d'améliorer le débit vers le GPU, en éliminant les goulots d'étranglement du processeur dans les serveurs.

Ce n'est pas pertinent pour un GPU de bureau, mais nous pouvons voir une approche similaire avec le RTX 4080. Nvidia et IBM se sont associés pour améliorer la bande passante et le débit de la mémoire en connectant un SSD directement au GPU. Nous avons supposé qu'il s'agissait d'une technologie lointaine, mais GTC suggère qu'elle pourrait apparaître plus tôt que tard.

En fin de compte, cependant, le RTX 4080 reste un gros point d'interrogation. Nous avons des fuites sur les performances et l'efficacité, ainsi que quelques indices de Hopper, mais nous devrons attendre le lancement de la carte pour tout savoir à ce sujet. Selon les rumeurs, il devrait être lancé cet automne, bien que Nvidia n'ait pas confirmé ce calendrier.