Google lance Gemma en japonais : un modèle de 2 milliards de paramètres rivalisant avec GPT-3.5, une percée majeure pour l'IA open source

Google a annoncé une grande nouvelle lors de la journée des développeurs Gemma à Tokyo : le lancement officiel du nouveau modèle Gemma en japonais. Ce modèle d'IA compact et performant, avec seulement 2 milliards de paramètres, maîtrise à la fois le japonais et l'anglais, affichant des performances comparables à celles de GPT-3.5.

Cette percée technologique est particulièrement remarquable. Dans le domaine de l'IA, les petits modèles sont souvent confrontés au défi de « l'oubli catastrophique » lors de l'apprentissage de nouvelles langues – c'est-à-dire la perte de capacités précédemment acquises lors de l'acquisition de nouvelles connaissances. Le modèle Gemma en japonais a réussi à surmonter ce problème, réalisant un équilibre parfait entre les deux langues.

Pour encourager la participation de la communauté mondiale des développeurs, Google a non seulement rendu les poids du modèle accessibles via les plateformes Kaggle et Hugging Face, mais a également fourni des données d'entraînement complètes et des exemples de code. Grâce à sa conception simplifiée, ce modèle peut même fonctionner localement sur des appareils mobiles, ouvrant de nouvelles possibilités pour les applications de calcul en périphérie.

Google a également lancé un concours « Gemma Global Exchange Unlock » d'un montant de 150 000 $, encourageant les développeurs à adapter Gemma à davantage de langues. Des projets d'adaptation en arabe, en vietnamien et en zoulou sont déjà en cours. Parallèlement, le projet « Navarasa » en Inde vise à prendre en charge 12 langues indiennes, et d'autres équipes explorent l'optimisation des dialectes coréens.

En tant que dernier membre de la série Gemma2, lancée par Google fin juillet, ce modèle s'inscrit dans la philosophie de « faire grand avec petit ». Comme les produits similaires lancés par Meta, il privilégie l'efficacité et la capacité de traitement local. Il est intéressant de noter que ce modèle de 2 milliards de paramètres surpasse même LLaMA-2, qui compte 70 milliards de paramètres, sur certaines tâches.

Les développeurs et les chercheurs peuvent accéder gratuitement à Gemma-2-2B et aux autres modèles de la série Gemma via plusieurs plateformes, telles que Hugging Face, Google AI Studio et Google Colab. Ces modèles sont également disponibles sur le marché des modèles Vertex AI. Cet ensemble de mesures offrira aux développeurs d'IA du monde entier davantage de possibilités d'innovation.

Actualités IA

Google lance Gemma en japonais : un modèle de 2 milliards de paramètres rivalisant avec GPT-3.5, une percée majeure pour l'IA open source

AIbase基地