Gemma 2 es un modelo de IA de código abierto de última generación desarrollado por Google DeepMind, que ofrece versiones con 900 millones y 2700 millones de parámetros. Se caracteriza por su rendimiento y eficiencia de inferencia excepcionales, permitiendo una ejecución eficiente a plena precisión en diferentes tipos de hardware y reduciendo significativamente los costes de implementación. La versión de 2700 millones de parámetros de Gemma 2 ofrece el doble de capacidad competitiva que modelos de su mismo tamaño, y puede ejecutarse en una sola GPU NVIDIA H100 Tensor Core o en una TPU de Google, lo que reduce considerablemente los costes de implementación.