Lors de la conférence GTC2025, Nvidia a officiellement annoncé sa nouvelle plateforme de puces d'intelligence artificielle (IA), baptisée « Vera Rubin » en hommage à la célèbre astronome américaine Vera Rubin, poursuivant ainsi la tradition de Nvidia de nommer ses architectures d'après des scientifiques. Le premier produit de cette série, la Vera Rubin NVL144, devrait sortir au second semestre 2026.

Le PDG de Nvidia, Jensen Huang, a déclaré que les performances de Rubin seraient 900 fois supérieures à celles de l'architecture Hopper actuelle. À titre de comparaison, la dernière architecture Blackwell a déjà permis une amélioration des performances de 68 fois par rapport à Hopper, ce qui laisse présager un bond en avant considérable des capacités de calcul avec Rubin.

QQ20250319-095910.png

Selon les informations officielles, la Vera Rubin NVL144 affiche une puissance de calcul d'inférence de 3,6 ExaFLOPS en précision FP4 et de 1,2 ExaFLOPS en précision FP8 pour l'entraînement. Par rapport à la GB300NVL72, les performances ont été améliorées de 3,3 fois. Rubin sera équipée de la dernière mémoire HBM4, avec une bande passante impressionnante de 13 To/s, et d'une mémoire rapide de 75 To, soit 1,6 fois plus que la génération précédente. En termes d'interconnexion, Rubin prend en charge NVLink6 et CX9, avec des bandes passantes respectives de 260 To/s et 28,8 To/s, soit le double de la génération précédente.

La version standard de la puce Rubin sera équipée de la mémoire HBM4, et ses performances globales seront largement supérieures à celles de la puce Hopper H100, actuellement la plus performante.

Il est à noter que la plateforme Rubin introduira également un nouveau processeur appelé Veru, successeur du processeur Grace. Veru comprend 88 cœurs Arm personnalisés, chaque cœur prenant en charge 176 threads, et une connexion haute bande passante jusqu'à 1,8 To/s grâce à NVLink-C2C. Nvidia affirme que la vitesse du processeur Vera personnalisé sera deux fois supérieure à celle du processeur utilisé dans la puce Grace Blackwell de l'année dernière.

QQ20250319-095918.png

Utilisée avec le processeur Vera, la puissance de calcul de Rubin pour les tâches d'inférence peut atteindre 50 pétaflops, soit plus du double des 20 pétaflops de Blackwell. De plus, Rubin prendra en charge jusqu'à 288 Go de mémoire HBM4, ce qui est crucial pour les développeurs qui doivent traiter de grands modèles d'IA.

Comme Blackwell, Rubin est en fait composée de deux GPU intégrés grâce à une technique d'assemblage avancée pour fonctionner comme un tout, améliorant ainsi l'efficacité et les performances globales du calcul. Le lancement de Rubin démontre une fois de plus la puissante capacité d'innovation de Nvidia dans le domaine des puces IA et sa profonde compréhension des besoins futurs en matière de puissance de calcul.