Na conferência GTC2025, a Nvidia anunciou oficialmente sua próxima plataforma de chip de inteligência artificial (IA), denominada "Vera Rubin", em homenagem à renomada astrônoma americana Vera Rubin, seguindo a tradição da Nvidia de nomear suas arquiteturas com nomes de cientistas. O primeiro produto da série, o Vera Rubin NVL144, tem lançamento previsto para o segundo semestre de 2026.
O CEO da Nvidia, Jensen Huang, afirmou que o desempenho do Rubin será 900 vezes superior ao da arquitetura Hopper atual. Em comparação, a mais recente arquitetura Blackwell já alcançou um aumento de 68 vezes no desempenho em relação à Hopper, indicando que o Rubin proporcionará um salto de poder computacional ainda maior.
De acordo com informações oficiais, o Vera Rubin NVL144 possui uma capacidade de inferência de 3,6 ExaFLOPS em precisão FP4 e um desempenho de treinamento de 1,2 ExaFLOPS em precisão FP8. Em comparação com o GB300NVL72, o desempenho foi aumentado em 3,3 vezes. O Rubin será equipado com a mais recente memória HBM4, com uma largura de banda impressionante de 13 TB/s, e 75 TB de memória rápida, 1,6 vezes maior que a geração anterior. Em termos de interconexão, o Rubin suporta NVLink6 e CX9, com larguras de banda de 260 TB/s e 28,8 TB/s, respectivamente, o dobro da geração anterior.
O chip Rubin versão padrão será equipado com memória HBM4, e seu desempenho geral superará em muito o atual chip Hopper H100 de nível superior.
Vale ressaltar que a plataforma Rubin também introduzirá uma nova CPU chamada Veru, sucessora da CPU Grace. A Veru contém 88 núcleos Arm personalizados, cada um suportando 176 threads, e possui uma conexão de alta largura de banda de até 1,8 TB/s por meio do NVLink-C2C. A Nvidia afirma que a velocidade da CPU Vera personalizada será o dobro da CPU usada no chip Grace Blackwell do ano passado.
Quando usado com a CPU Vera, o Rubin pode atingir 50 petaflops em tarefas de inferência, mais do que o dobro dos 20 petaflops do Blackwell. Além disso, o Rubin suportará até 288 GB de memória HBM4, o que é crucial para desenvolvedores que precisam processar grandes modelos de IA.
Similar ao Blackwell, o Rubin é composto por dois GPUs, integrados em um único sistema por meio de uma tecnologia de encapsulamento avançada, melhorando ainda mais a eficiência e o desempenho de computação geral. O lançamento do Rubin demonstra mais uma vez a poderosa capacidade de inovação da Nvidia na área de chips de IA e sua profunda compreensão das necessidades futuras de poder computacional.