En la reciente conferencia Google I/O Berlín, Google anunció la publicación de código abierto de su último modelo de lenguaje, Gemma2, que ha logrado avances significativos en rendimiento y eficiencia. Gemma2 está disponible en dos versiones, con 9B y 27B parámetros. La versión de 27B parámetros ofrece un rendimiento cercano al modelo Llama3 de 70B parámetros, pero con un tamaño de modelo aproximadamente 40% menor.
Características principales de Gemma2:
(1) Disponible en tamaños de 9B y 27B parámetros
(2) Rendimiento de primera clase
(3) Inferencia eficiente (se ejecuta en una sola GPU NVIDIA H100 o TPU host)
(4) Modelo fácil de usar, diseñado para desarrolladores e investigadores
Además, Gemma2 presenta las siguientes características:
(1) Rendimiento excepcional: el modelo de 27B parámetros es comparable al modelo Llama3 de 70B parámetros, que es más del doble de grande.
(2) Alta eficiencia: inferencia de precisión completa en una sola GPU.
(3) Amplia compatibilidad de hardware: desde portátiles para juegos hasta la nube.
(4) Licencia abierta: también se puede utilizar con fines comerciales.
Diseño amigable para desarrolladores
Para facilitar su uso, Gemma2 es compatible con varios frameworks de IA populares, como Hugging Face, JAX, PyTorch y TensorFlow. Google también proporciona el nuevo Gemma2Cookbook, que incluye ejemplos y guías de aplicaciones prácticas. Además, Google planea admitir la fácil implementación de Gemma2 a través de Google Cloud Vertex AI en un futuro próximo.
En cuanto al desarrollo responsable de la IA, Google ha lanzado una serie de iniciativas, incluyendo un kit de herramientas responsable de IA generativa, un comparador de LLM de código abierto (para la evaluación de modelos) y planes para publicar con código abierto la tecnología de marca de agua de texto SynthID. Google también se compromete a realizar evaluaciones de seguridad rigurosas y a publicar los resultados.
Actualmente, los desarrolladores e investigadores pueden acceder al modelo Gemma2 de forma gratuita a través de Google AI Studio. Los pesos del modelo también se pueden descargar desde las plataformas Kaggle y Hugging Face. Para los investigadores académicos, Google también ofrece un programa de créditos de Google Cloud, con fecha límite de solicitud el 9 de agosto.
Cabe destacar que Gemma2 superó al modelo QWen1.5 en la lista de clasificación LMSys, lo que demuestra aún más su potente rendimiento. Este avance revolucionario traerá nuevas oportunidades y desafíos al campo de la IA, impulsando el desarrollo de modelos de lenguaje de código abierto.
Dirección de experiencia oficial: https://aistudio.google.com/app/prompts/new_freeform