Gemma 2 est un modèle IA open source de nouvelle génération développé par Google DeepMind. Il est disponible en versions 900 millions et 2,7 milliards de paramètres, offrant des performances et une efficacité d'inférence exceptionnelles. Il est conçu pour fonctionner efficacement en pleine précision sur différents matériels, réduisant considérablement les coûts de déploiement. La version 2,7 milliards de paramètres offre des performances deux fois supérieures à celles des modèles de taille comparable, et peut être exécutée sur un seul GPU NVIDIA H100 Tensor Core ou un TPU hôte, réduisant ainsi significativement les coûts de déploiement.