Le 9 avril 2025, lors de la conférence Google Cloud Next 2025, Google Cloud a annoncé un partenariat majeur combinant son service de cloud distribué, Google Distributed Cloud (GDC), avec le modèle d'intelligence artificielle Gemini et l'architecture Blackwell de NVIDIA, afin d'offrir aux entreprises des solutions IA locales performantes. Ce partenariat vise à répondre aux besoins stricts en matière de souveraineté et de sécurité des données dans certains secteurs, et à promouvoir l'utilisation de la technologie « IA agentive » (Agentic AI) en environnement local.
Selon les dernières informations, Google Distributed Cloud permettra l'exécution du modèle Gemini dans les datacenters des entreprises. Cette initiative, rendue possible grâce à la collaboration avec NVIDIA, utilise le nouveau système de GPU Blackwell de NVIDIA pour fournir une puissance de calcul élevée. Dell, partenaire clé, fournira le support matériel pour cette solution, garantissant aux entreprises la flexibilité d'un cloud public tout en conservant un contrôle total sur leurs données. Il est important de noter que cette solution convient non seulement aux environnements connectés, mais aussi aux scénarios totalement isolés (« air-gapped »), particulièrement adaptés aux organismes gouvernementaux, aux secteurs hautement réglementés et aux entreprises ayant des exigences spécifiques en matière de latence et de résidence des données.
L'un des points forts de ce partenariat est l'intégration de la technologie de calcul confidentiel (Confidential Computing) de NVIDIA, garantissant une protection de bout en bout des données et des invites (prompts) lors du traitement de données sensibles par le modèle Gemini, même pour le fournisseur de services cloud. Cette combinaison de sécurité et de performance est considérée comme une étape clé pour libérer le potentiel de l'IA locale. Sachin Gupta, vice-président et directeur général de l'infrastructure et des solutions Google Cloud, a déclaré : « En combinant le modèle Gemini avec les performances révolutionnaires et les capacités de calcul confidentiel de NVIDIA Blackwell, nous offrons aux entreprises la possibilité d'innover en toute sécurité, sans compromis sur les performances ou la facilité d'utilisation. »
De plus, Google Distributed Cloud prévoit de lancer GKE Inference Gateway, un outil intégré à NVIDIA Triton Inference Server et NeMo Guardrails, destiné à optimiser le routage de l'inférence et l'équilibrage de la charge, aidant les entreprises à gérer et à étendre plus efficacement leurs charges de travail d'IA. Cette fonctionnalité devrait être disponible en préversion publique au troisième trimestre 2025, offrant ainsi à davantage d'entreprises la possibilité de l'essayer.
Les experts du secteur estiment que ce partenariat marque un tournant majeur dans les modèles de déploiement de l'IA. Pendant longtemps, de nombreuses entreprises n'ont pas pu pleinement exploiter les technologies d'IA les plus avancées en raison des limitations du déploiement dans le cloud et des préoccupations en matière de sécurité. La solution conjointe de Google et de NVIDIA permet aux entreprises d'exécuter localement des agents IA complexes capables non seulement de comprendre les données, mais aussi de raisonner, d'agir et de s'auto-optimiser. Cette tendance est considérée comme une étape importante vers des systèmes d'IA d'entreprise « auto-correcteurs » et « auto-améliorants ».
La collaboration entre Google Cloud et NVIDIA ne se limite pas à l'aspect technique ; elle reflète également la vision commune des deux entreprises en matière de démocratisation de l'IA. En intégrant le modèle Gemini dans un environnement local et en combinant les performances exceptionnelles de l'architecture Blackwell, cette solution devrait créer de nouvelles opportunités de croissance pour les secteurs de la finance, de la santé et de la fabrication, tout en répondant aux exigences de conformité les plus strictes. À l'avenir, à mesure que davantage de détails seront dévoilés et que les applications concrètes se multiplieront, ce partenariat pourrait bien redéfinir le paysage du déploiement de l'IA en entreprise.