Cette nouvelle technologie résout le plus gros problème des GPU modernes

Extension du stockage GPU
Panmnésie

Dans le cadre d’un développement intéressant pour l’industrie des GPU, la mémoire connectée PCIe est sur le point de changer notre perception de la capacité et des performances de la mémoire GPU. Panmnesia, une société soutenue par l'institut de recherche sud-coréen KAIST, travaille sur une technologie appelée Compute Express Link, ou CXL, qui permet aux GPU d'utiliser des ressources de mémoire externes via l'interface PCIe.

Traditionnellement, les GPU comme le RTX 4060 sont limités par leur VRAM intégrée, ce qui peut gêner les performances dans les tâches gourmandes en mémoire telles que la formation à l'IA, l'analyse des données et les jeux haute résolution. CXL exploite la connexion PCIe haut débit pour connecter des modules de mémoire externes directement au GPU.

Cette méthode offre une option d'extension de mémoire à faible latence, avec des mesures de performances montrant des améliorations significatives par rapport aux méthodes traditionnelles. Selon les rapports, la nouvelle technologie parvient à atteindre une latence à deux chiffres en nanosecondes, ce qui représente une réduction substantielle par rapport aux solutions standards basées sur SSD.

Extension du stockage GPU à l'aide de CXL.
Pamnésie

De plus, cette technologie ne se limite pas à la RAM traditionnelle. Les SSD peuvent également être utilisés pour étendre la mémoire GPU, offrant ainsi une solution polyvalente et évolutive. Cette capacité permet la création de systèmes de mémoire hybrides combinant la vitesse de la RAM avec la capacité des SSD, améliorant ainsi encore les performances et l'efficacité.

Bien que CXL fonctionne sur une liaison PCIe, l'intégration de cette technologie aux GPU n'est pas simple. Les GPU ne disposent pas de la structure logique et des sous-systèmes CXL nécessaires pour prendre en charge les points de terminaison DRAM ou SSD. Par conséquent, il n’est pas possible d’ajouter simplement un contrôleur CXL.

Les systèmes de cache et de mémoire GPU reconnaissent uniquement les extensions via la mémoire virtuelle unifiée (UVM). Cependant, les tests effectués par Panmnesia ont révélé que UVM avait les performances les plus médiocres parmi les noyaux GPU testés en raison de la surcharge due à l'intervention de l'exécution de l'hôte lors de défauts de page et de transferts de données inefficaces au niveau de la page.

Pour résoudre ce problème, Panmnesia a développé une série de couches matérielles prenant en charge tous les protocoles CXL clés, regroupés dans un contrôleur unifié. Ce complexe racine compatible CXL 3.1 comprend plusieurs ports racine pour la mémoire externe sur PCIe et un pont hôte avec un décodeur de mémoire de périphérique géré par l'hôte. Ce décodeur se connecte au bus système du GPU et gère la mémoire système, offrant un accès direct au stockage étendu via des instructions de chargement/stockage, éliminant ainsi efficacement les problèmes d'UVM.

Les implications de cette technologie sont considérables. Pour l’IA et l’apprentissage automatique, la possibilité d’ajouter plus de mémoire signifie gérer plus efficacement des ensembles de données plus volumineux, accélérer les temps de formation et améliorer la précision des modèles. Dans le domaine des jeux, les développeurs peuvent repousser les limites de la fidélité graphique et de la complexité sans être limités par les limitations de la VRAM.

Pour les centres de données et les environnements de cloud computing, la technologie CXL de Panmnesia constitue un moyen rentable de mettre à niveau l'infrastructure existante. En connectant de la mémoire supplémentaire via PCIe, les centres de données peuvent améliorer leur puissance de calcul sans nécessiter de révisions matérielles approfondies.

Malgré son potentiel, Panmnesia est confronté à un défi de taille pour être adopté à l’échelle de l’industrie. Les meilleures cartes graphiques d'AMD et de Nvidia ne prennent pas en charge CLX et pourraient ne jamais le prendre en charge. Il existe également de fortes chances que les acteurs du secteur développent leurs propres technologies de mémoire connectées PCIe pour les GPU. Néanmoins, l'innovation de Panmnesia représente un pas en avant dans la résolution des goulots d'étranglement de la mémoire GPU, avec le potentiel d'avoir un impact significatif sur le calcul et les jeux hautes performances.