Google a récemment lancé Trillium, sa sixième génération de puces d'accélération pour l'intelligence artificielle. L'entreprise affirme que cette avancée technologique révolutionnaire pourrait fondamentalement transformer l'économie du développement de l'IA et repousser les limites de l'apprentissage automatique. Trillium a démontré une amélioration significative des performances lors de l'entraînement du nouveau modèle d'IA Gemini 2.0 de Google, quadruplant la vitesse d'entraînement par rapport à la génération précédente tout en réduisant considérablement la consommation d'énergie.

image.png

Lors de la présentation, Sundar Pichai, PDG de Google, a souligné que la puce Trillium est au cœur de la stratégie IA de l'entreprise, et que l'entraînement et l'inférence de Gemini 2.0 reposent entièrement sur cette puce. Google a déjà interconnecté plus de 100 000 puces Trillium au sein d'un seul réseau, créant ainsi l'un des supercalculateurs IA les plus puissants au monde.

Les spécifications techniques de la puce Trillium marquent des progrès significatifs sur plusieurs aspects. Par rapport à sa génération précédente, Trillium affiche une augmentation de 4,7 fois des performances de calcul par puce, ainsi qu'un doublement de la capacité de la mémoire haute bande passante et de la bande passante de la connexion inter-puces. Plus important encore, l'efficacité énergétique de la puce a été améliorée de 67 %, un indicateur crucial dans un contexte de pression énergétique considérable sur les centres de données.

image.png

Sur le plan économique, les performances de Trillium sont également très impressionnantes. Google indique que, par rapport à la génération précédente, Trillium offre un gain de 2,5 fois en termes de performances d'entraînement par dollar investi, ce qui pourrait révolutionner le modèle économique du développement de l'IA. AI21Labs, un utilisateur précoce de Trillium, a déjà signalé des améliorations notables. Barak Lenz, directeur technique de la société, a déclaré que les progrès en termes d'échelle, de vitesse et de rentabilité étaient extrêmement significatifs.

Le déploiement de Trillium dans l'architecture du supercalculateur IA de Google met en évidence son approche intégrée de l'infrastructure IA. Ce système, qui combine plus de 100 000 puces Trillium et le réseau Jupiter de 13 péta-bits par seconde, permet la mise à l'échelle d'une seule tâche d'entraînement distribuée sur des centaines de milliers d'accélérateurs.

Le lancement de Trillium va intensifier la concurrence dans le secteur du matériel IA, notamment sur un marché dominé par Nvidia. Bien que les GPU de Nvidia restent la norme pour de nombreuses applications d'IA, la solution de puces personnalisées de Google pourrait présenter des avantages pour des charges de travail spécifiques. Les analystes du secteur soulignent que les investissements massifs de Google dans le développement de puces personnalisées reflètent son jugement stratégique sur l'importance croissante de l'infrastructure IA.

Avec les progrès technologiques constants, Trillium ne représente pas seulement une amélioration des performances, mais aussi l'annonce d'un calcul IA plus accessible et économique. Google affirme que la possession d'une infrastructure matérielle et logicielle appropriée sera essentielle pour stimuler le progrès continu de l'IA. À l'avenir, avec la complexification croissante des modèles d'IA, les besoins en matériel de base augmenteront, et Google a clairement l'intention de conserver une position de leader dans ce domaine.

Blog officiel : https://cloud.google.com/blog/products/compute/trillium-tpu-is-ga

Points clés :

🌟 La puce Trillium améliore les performances de quatre fois, réduit considérablement la consommation d'énergie et stimule l'efficacité de l'entraînement de l'IA.

💰 Les performances d'entraînement par dollar investi sont améliorées de 2,5 fois, ce qui pourrait révolutionner le modèle économique du développement de l'IA.

🔗 Google a déployé plus de 100 000 puces Trillium, créant ainsi le supercalculateur IA le plus puissant au monde.