Baidu Intelligent Cloud a récemment allumé avec succès le premier cluster de 10 000 cartes Kunlun 3 de conception propre en Chine. Cette avancée majeure marque non seulement une étape importante pour Baidu dans le domaine de la puissance de calcul de l'intelligence artificielle, mais offre également de nouvelles pistes de développement à l'ensemble du secteur. Avec les progrès constants de la technologie, l'augmentation de la puissance de calcul est essentielle pour soutenir l'entraînement et l'application de modèles à grande échelle.

Au cours de l'année écoulée, avec la popularisation de l'IA, de nombreuses entreprises ont été confrontées à un problème de manque de puissance de calcul, ce qui a entraîné une augmentation significative des coûts d'utilisation des grands modèles. Baidu a déclaré que grâce à la conception de ses propres puces et à la construction de clusters de 10 000 cartes, elle a non seulement résolu efficacement ses propres problèmes d'approvisionnement en puissance de calcul, mais a également fourni des références et un soutien à d'autres entreprises. Les clusters de 10 000 cartes possèdent une capacité de calcul parallèle à très grande échelle, ce qui permet d'améliorer considérablement l'efficacité de l'entraînement, en particulier pour l'entraînement de modèles complexes à des milliards de paramètres, réduisant ainsi considérablement la durée de l'entraînement.

Centre de données Superordinateur (2)

Source : Image générée par IA, fournisseur de services d'autorisation d'images : Midjourney

L'application de clusters de 10 000 cartes répondra aux besoins d'itération rapide des applications natives de l'IA, et pourra également prendre en charge le traitement de modèles à des milliers de milliards de paramètres et de données multimodales, fournissant une puissante impulsion au développement d'applications de type Sora. De plus, la capacité de traitement simultané de plusieurs tâches des clusters de 10 000 cartes leur permet, grâce à un partage dynamique des ressources, d'entraîner simultanément plusieurs modèles légers, permettant ainsi une utilisation efficace de la puissance de calcul. Cette innovation de Baidu Intelligent Cloud a non seulement amélioré le taux d'utilisation global du cluster, mais a également considérablement réduit le coût unitaire de la puissance de calcul.

Cependant, les problèmes de formation mixte multi-puces et l'augmentation du taux de défaillance dans le passé ont constitué les principaux défis du déploiement de clusters de 10 000 cartes. Pour résoudre ces problèmes, Baidu a lancé en septembre 2024 la version améliorée de la plateforme de calcul hétérogène AI Baige 4.0, qui a joué un rôle crucial dans la construction de clusters de 10 000 cartes. Grâce à l'optimisation des modèles, aux stratégies de parallélisation et à l'allocation dynamique des ressources, Baidu Intelligent Cloud encourage une utilisation efficace de la puissance de calcul, jetant ainsi les bases des futures applications de l'IA.

Le succès de Baidu Intelligent Cloud démontre non seulement ses capacités de recherche et développement indépendantes, mais injecte également une nouvelle dynamique au développement rapide des grands modèles nationaux. À l'avenir, avec l'expansion et l'optimisation continues des clusters de 10 000 cartes, nous attendons avec impatience la mise en œuvre de plus d'applications IA innovantes, créant ainsi de nouvelles opportunités pour le développement du secteur.