Gemma 2 ist das nächste Generation Google Gemma-Modell mit 2,7 Milliarden Parametern. Es bietet eine vergleichbare Leistung wie Llama 3 70B, bei nur halb so großer Modellgröße. Es ist optimiert für den Betrieb auf NVIDIA GPUs oder effizient auf einem einzelnen TPU-Host auf Vertex AI, wodurch die Bereitstellungskosten gesenkt und ein breiterer Zugriff ermöglicht wird. Gemma 2 bietet außerdem eine leistungsstarke Tuning-Toolchain mit Unterstützung für Cloud-Lösungen und Community-Tools wie Google Cloud und Axolotl sowie nahtlose Partnerintegrationen mit Hugging Face und NVIDIA TensorRT-LLM.