Google publie Gemma2, son modèle linguistique open source le plus puissant, surpassant Llama3

Lors du récent Google I/O à Berlin, Google a annoncé l'open source de son dernier modèle linguistique, Gemma2, qui marque une avancée significative en termes de performance et d'efficacité. Gemma2 est disponible en deux versions, avec 9 milliards et 27 milliards de paramètres. La version 27 milliards de paramètres atteint des performances proches de celles du modèle Llama3 (70 milliards de paramètres), tout en étant environ 40% plus petite.

Caractéristiques principales de Gemma2 :

(1) Disponible en deux tailles : 9 milliards et 27 milliards de paramètres

(2) Performances de pointe

(3) Infèrence efficace (fonctionne sur un seul GPU NVIDIA H100 ou TPU)

(4) Modèle simple d'utilisation, conçu pour les développeurs et les chercheurs

Autres caractéristiques de Gemma2 :

(1) Performances exceptionnelles : le modèle à 27 milliards de paramètres rivalise avec Llama3 70 milliards de paramètres, plus de deux fois plus grand.

(2) Haute efficacité : inférence en précision entière sur un seul GPU.

(3) Large compatibilité matérielle : des ordinateurs portables gamers au cloud.

(4) Licence ouverte : utilisable également à des fins commerciales.

Conception conviviale pour les développeurs

Pour faciliter son utilisation, Gemma2 est compatible avec les principaux frameworks d'IA, tels que Hugging Face, JAX, PyTorch et TensorFlow. Google fournit également un nouveau Gemma2Cookbook avec des exemples d'applications et des guides. De plus, Google prévoit de permettre prochainement le déploiement facile de Gemma2 via Google Cloud Vertex AI.

twitter_Tom Huang(@tuturetom)_20240627-161818_1806361424043885034_photo.jpg

Concernant le développement responsable de l'IA, Google a lancé plusieurs initiatives, notamment la mise à disposition d'une boîte à outils pour l'IA générative responsable, un comparateur LLM open source (pour l'évaluation des modèles), et prévoit d'ouvrir la source de la technologie de filigrane textuel SynthID. Google s'engage également à réaliser des évaluations de sécurité rigoureuses et à publier les résultats.

twitter_Tom Huang(@tuturetom)_20240627-161849_1806361553094234268_photo.jpg

Actuellement, les développeurs et les chercheurs peuvent accéder gratuitement au modèle Gemma2 via Google AI Studio. Les poids du modèle sont également téléchargeables sur Kaggle et Hugging Face. Pour les chercheurs universitaires, Google propose un programme de crédits Google Cloud, dont la date limite de candidature est le 9 août.

Il est à noter que Gemma2 surpasse le modèle QWen1.5 dans le classement LMSys, confirmant ainsi ses performances exceptionnelles. Cette avancée majeure ouvrira de nouvelles opportunités et défis dans le domaine de l'IA, et stimulera le développement des modèles linguistiques open source.

Adresse d'essai officiel : https://aistudio.google.com/app/prompts/new_freeform

Actualités IA

Google publie Gemma2, son modèle linguistique open source le plus puissant, surpassant Llama3

AIbase

Recommandations d'actualités IA connexes

FoxBrain : un modèle linguistique chinois de grande envergure lancé par Foxconn en seulement quatre semaines !

Plateforme nationale d'internet de supercalcul intégrée au grand modèle linguistique Qwen d'Alibaba : API QwQ-32B disponible

Le grand modèle de raisonnement Ali Tongyi Qianwen QwQ-32B prend la tête du classement de la communauté open source mondiale

Babel, le grand modèle linguistique open source d'Alibaba, prend en charge 25 langues et touche 90% de la population mondiale