Lors du récent Google I/O à Berlin, Google a annoncé l'open source de son dernier modèle linguistique, Gemma2, qui marque une avancée significative en termes de performance et d'efficacité. Gemma2 est disponible en deux versions, avec 9 milliards et 27 milliards de paramètres. La version 27 milliards de paramètres atteint des performances proches de celles du modèle Llama3 (70 milliards de paramètres), tout en étant environ 40% plus petite.
Caractéristiques principales de Gemma2 :
(1) Disponible en deux tailles : 9 milliards et 27 milliards de paramètres
(2) Performances de pointe
(3) Infèrence efficace (fonctionne sur un seul GPU NVIDIA H100 ou TPU)
(4) Modèle simple d'utilisation, conçu pour les développeurs et les chercheurs
Autres caractéristiques de Gemma2 :
(1) Performances exceptionnelles : le modèle à 27 milliards de paramètres rivalise avec Llama3 70 milliards de paramètres, plus de deux fois plus grand.
(2) Haute efficacité : inférence en précision entière sur un seul GPU.
(3) Large compatibilité matérielle : des ordinateurs portables gamers au cloud.
(4) Licence ouverte : utilisable également à des fins commerciales.
Conception conviviale pour les développeurs
Pour faciliter son utilisation, Gemma2 est compatible avec les principaux frameworks d'IA, tels que Hugging Face, JAX, PyTorch et TensorFlow. Google fournit également un nouveau Gemma2Cookbook avec des exemples d'applications et des guides. De plus, Google prévoit de permettre prochainement le déploiement facile de Gemma2 via Google Cloud Vertex AI.
Concernant le développement responsable de l'IA, Google a lancé plusieurs initiatives, notamment la mise à disposition d'une boîte à outils pour l'IA générative responsable, un comparateur LLM open source (pour l'évaluation des modèles), et prévoit d'ouvrir la source de la technologie de filigrane textuel SynthID. Google s'engage également à réaliser des évaluations de sécurité rigoureuses et à publier les résultats.
Actuellement, les développeurs et les chercheurs peuvent accéder gratuitement au modèle Gemma2 via Google AI Studio. Les poids du modèle sont également téléchargeables sur Kaggle et Hugging Face. Pour les chercheurs universitaires, Google propose un programme de crédits Google Cloud, dont la date limite de candidature est le 9 août.
Il est à noter que Gemma2 surpasse le modèle QWen1.5 dans le classement LMSys, confirmant ainsi ses performances exceptionnelles. Cette avancée majeure ouvrira de nouvelles opportunités et défis dans le domaine de l'IA, et stimulera le développement des modèles linguistiques open source.
Adresse d'essai officiel : https://aistudio.google.com/app/prompts/new_freeform