Récemment, la nouvelle puce IA Blackwell de NVIDIA a rencontré des problèmes de surchauffe dans les serveurs, suscitant des inquiétudes chez les clients quant à la mise en service de leurs nouveaux centres de données. Selon The Information, les unités de traitement graphique (GPU) Blackwell surchauffent lorsqu'elles sont connectées à des baies de serveurs conçues pour accueillir 72 puces.
Selon des sources informées, l'équipe d'ingénierie de NVIDIA travaille activement à résoudre ce problème. Les employés de l'entreprise ont à plusieurs reprises demandé aux fournisseurs d'adapter la conception des baies pour éviter toute surchauffe supplémentaire. Parallèlement, un porte-parole de NVIDIA a déclaré à Seeking Alpha : «NVIDIA collabore étroitement avec les principaux fournisseurs de services cloud, ce qui fait partie intégrante de nos équipes et processus d'ingénierie. Les itérations d'ingénierie sont un processus normal et prévisible.»
La puce Blackwell a été dévoilée en mars dernier. NVIDIA avait annoncé un lancement au deuxième trimestre, mais des retards sont survenus. Ce problème représente un défi pour l'entreprise, car il affecte non seulement le calendrier de lancement du nouveau produit, mais aussi les plans opérationnels des clients.
Avec le développement rapide de l'IA et la demande croissante de calcul haute performance, NVIDIA, en tant que leader du secteur, souhaite naturellement tirer parti de cette vague. Cependant, si le problème de surchauffe n'est pas résolu rapidement, cela pourrait nuire à la réputation de l'entreprise et à la satisfaction de ses clients. Les experts du secteur soulignent qu'il est crucial de résoudre ces problèmes techniques, notamment avant un déploiement à grande échelle, car cela aura un impact direct sur les performances et la fiabilité des centres de données.
Dans ce contexte, l'équipe d'ingénierie de NVIDIA travaille d'arrache-pied pour corriger ce défaut et garantir le bon fonctionnement de la puce Blackwell. Les clients suivent de près l'évolution de la situation et espèrent une solution rapide afin de pouvoir mettre en service leurs nouveaux centres de données et répondre à leurs besoins informatiques croissants.
Points clés :
🌡️ La puce IA Blackwell surchauffe dans les serveurs, ce qui inquiète les clients.
🔧 NVIDIA collabore avec les fournisseurs de services cloud pour tenter d'adapter la conception des baies afin de résoudre le problème.
📅 La puce Blackwell a été lancée en mars, initialement prévue pour le deuxième trimestre, mais son lancement a été retardé.