Gemma 2 é um modelo de IA de código aberto de próxima geração lançado pelo Google DeepMind, oferecendo versões com 900 milhões e 2,7 bilhões de parâmetros. Apresenta desempenho e eficiência de raciocínio excepcionais, permitindo execução eficiente em alta precisão em diferentes hardwares, reduzindo significativamente os custos de implantação. A versão de 2,7 bilhões de parâmetros do Gemma 2 oferece o dobro da capacidade competitiva de modelos de tamanho semelhante e pode ser executada em uma única GPU NVIDIA H100 Tensor Core ou TPU host, reduzindo significativamente os custos de implantação.