Lors de la conférence GTC du 18 mars, Jensen Huang, PDG de Nvidia, a annoncé un plan ambitieux visant à accélérer le traitement de l'intelligence artificielle de DeepSeek de 30 fois grâce à son nouveau logiciel Dynamo. Cette initiative est une réponse de Nvidia aux perturbations du marché causées par le programme d'IA R1 de DeepSeek. La technologie de DeepSeek réduit considérablement la puissance de calcul nécessaire pour chaque requête, ce qui a suscité des inquiétudes chez les investisseurs quant aux perspectives futures de Nvidia.

QQ_1742352534028.png

Le logiciel Dynamo de Nvidia permet de répartir les tâches d'inférence IA sur jusqu'à 1000 GPU pour un traitement parallèle, améliorant considérablement le débit des requêtes. M. Huang a déclaré que, grâce à la nouvelle puce Blackwell, Dynamo offre une capacité de traitement 30 fois supérieure sous la même architecture. Cette amélioration permet aux centres de données d'IA de traiter un plus grand nombre de jetons par seconde, augmentant ainsi les revenus globaux.

Plus précisément, le logiciel Dynamo permet d'améliorer le débit à un coût de 1 $ par million de jetons. Cela signifie que les fournisseurs de services peuvent choisir de traiter simultanément les requêtes d'un plus grand nombre de clients ou d'offrir des services plus puissants à un seul utilisateur, facturant ainsi des prix plus élevés. Nvidia qualifie ce service IA haute performance d'"usine IA".

Pour améliorer encore les performances de DeepSeek, Nvidia a également publié sur HuggingFace une version ajustée de DeepSeek R1. Cette version utilise moins de bits de calcul, à savoir « FP4 », ce qui améliore considérablement les performances sans réduire significativement la précision du modèle.

En plus de Dynamo, Nvidia a lancé la dernière version de sa puce Blackwell, « Ultra », améliorant ainsi la capacité de mémoire et les performances globales. De plus, Nvidia a officiellement lancé le mini-ordinateur personnel DGX Spark pour les développeurs d'IA et a mis à jour la configuration de son ordinateur de bureau DGX Station.

Lors de cette conférence, Nvidia a également présenté de nombreux autres nouveaux produits et projets de collaboration, notamment des commutateurs réseau améliorés et des modèles logiciels pour les robots médicaux, démontrant ainsi la capacité d'innovation continue de Nvidia dans les domaines de l'IA et du calcul.

Points clés :

🌟 Nvidia lance le logiciel Dynamo, augmentant la vitesse de traitement de l'IA DeepSeek de 30 fois.

💰 Grâce à Dynamo, les fournisseurs de services peuvent traiter les requêtes des clients plus efficacement et augmenter leurs revenus.

🖥️ La nouvelle puce Blackwell « Ultra » et l'ordinateur DGX Spark sont également officiellement lancés lors de la conférence.