Google lanza Gemma2, su potente modelo de lenguaje de código abierto que supera a Llama3

En la reciente conferencia Google I/O Berlín, Google anunció la publicación de código abierto de su último modelo de lenguaje, Gemma2, que ha logrado avances significativos en rendimiento y eficiencia. Gemma2 está disponible en dos versiones, con 9B y 27B parámetros. La versión de 27B parámetros ofrece un rendimiento cercano al modelo Llama3 de 70B parámetros, pero con un tamaño de modelo aproximadamente 40% menor.

Características principales de Gemma2:

(1) Disponible en tamaños de 9B y 27B parámetros

(2) Rendimiento de primera clase

(3) Inferencia eficiente (se ejecuta en una sola GPU NVIDIA H100 o TPU host)

(4) Modelo fácil de usar, diseñado para desarrolladores e investigadores

Además, Gemma2 presenta las siguientes características:

(1) Rendimiento excepcional: el modelo de 27B parámetros es comparable al modelo Llama3 de 70B parámetros, que es más del doble de grande.

(2) Alta eficiencia: inferencia de precisión completa en una sola GPU.

(3) Amplia compatibilidad de hardware: desde portátiles para juegos hasta la nube.

(4) Licencia abierta: también se puede utilizar con fines comerciales.

Diseño amigable para desarrolladores

Para facilitar su uso, Gemma2 es compatible con varios frameworks de IA populares, como Hugging Face, JAX, PyTorch y TensorFlow. Google también proporciona el nuevo Gemma2Cookbook, que incluye ejemplos y guías de aplicaciones prácticas. Además, Google planea admitir la fácil implementación de Gemma2 a través de Google Cloud Vertex AI en un futuro próximo.

twitter_Tom Huang(@tuturetom)_20240627-161818_1806361424043885034_photo.jpg

En cuanto al desarrollo responsable de la IA, Google ha lanzado una serie de iniciativas, incluyendo un kit de herramientas responsable de IA generativa, un comparador de LLM de código abierto (para la evaluación de modelos) y planes para publicar con código abierto la tecnología de marca de agua de texto SynthID. Google también se compromete a realizar evaluaciones de seguridad rigurosas y a publicar los resultados.

twitter_Tom Huang(@tuturetom)_20240627-161849_1806361553094234268_photo.jpg

Actualmente, los desarrolladores e investigadores pueden acceder al modelo Gemma2 de forma gratuita a través de Google AI Studio. Los pesos del modelo también se pueden descargar desde las plataformas Kaggle y Hugging Face. Para los investigadores académicos, Google también ofrece un programa de créditos de Google Cloud, con fecha límite de solicitud el 9 de agosto.

Cabe destacar que Gemma2 superó al modelo QWen1.5 en la lista de clasificación LMSys, lo que demuestra aún más su potente rendimiento. Este avance revolucionario traerá nuevas oportunidades y desafíos al campo de la IA, impulsando el desarrollo de modelos de lenguaje de código abierto.

Dirección de experiencia oficial: https://aistudio.google.com/app/prompts/new_freeform

Noticias de IA

Google lanza Gemma2, su potente modelo de lenguaje de código abierto que supera a Llama3

AIbase

Noticias de IA relacionadas recomendadas

¡En solo cuatro semanas! Foxconn lanza FoxBrain, su modelo de lenguaje grande en chino

Plataforma Nacional de Internet de Supercomputación se integra con el modelo de lenguaje grande Qwen de Alibaba: API QwQ-32B disponible

Babel, el modelo de lenguaje grande de código abierto de Alibaba, admite 25 idiomas y empodera al 90% de la población mundial

Zhipu AI completa una ronda de financiación de más de 1000 millones de yuanes y planea la publicación de código abierto de un nuevo modelo de lenguaje grande