Mistral AI a récemment lancé un nouveau modèle linguistique nommé Saba, axé sur l'amélioration de la compréhension des différences linguistiques et culturelles au Moyen-Orient et en Asie du Sud-Est.

Le modèle Saba possède 24 milliards de paramètres. Bien qu'il soit moins volumineux que de nombreux concurrents, Mistral AI affirme qu'il offre une vitesse et un coût plus bas tout en garantissant la précision. Son architecture pourrait être similaire à celle du modèle Mistral Small3. Saba peut fonctionner efficacement sur des systèmes moins performants, atteignant même une vitesse de plus de 150 jetons par seconde sur une configuration à un seul GPU.

QQ20250218-091928.png

Ce modèle excelle particulièrement dans le traitement de l'arabe et de l'hindi, y compris les langues du sud de l'Inde comme le tamoul et le malayalam. Les tests de référence de Mistral AI montrent que Saba offre d'excellentes performances en arabe, tout en conservant des capacités comparables à celles de l'anglais.

Saba a déjà été utilisé dans des scénarios réels, notamment pour des assistants virtuels en arabe et des outils spécialisés dans les secteurs de l'énergie, des marchés financiers et des soins de santé. Sa compréhension des expressions idiomatiques et des références culturelles locales lui permet de générer efficacement du contenu spécifique à une région.

Les utilisateurs peuvent accéder à Saba via une API payante ou un déploiement local. Comme les autres modèles de Mistral AI, Saba n'est pas un modèle open source.

QQ20250218-091823.png

Les tests de référence de Mistral montrent que Saba excelle en arabe tout en conservant des capacités équivalentes en anglais | Source : Mistral AI

Le lancement de Saba témoigne de l'attention portée dans le domaine de l'IA aux besoins en modèles linguistiques spécifiques à une région. D'autres organisations, telles que le projet OpenGPT-X (ayant publié le modèle Teuken-7B), OpenAI (développant un modèle GPT-4 spécifique au japonais) et le projet EuroLingua (axé sur les langues européennes) mènent des recherches similaires.

Les grands modèles linguistiques traditionnels reposent principalement sur d'énormes ensembles de données textuelles en anglais pour leur entraînement, ce qui peut conduire à négliger les nuances de langues spécifiques. Saba vise à combler cette lacune en offrant des capacités de traitement linguistique plus précises et plus conformes au contexte culturel local.