Mistral AI ha lanzado recientemente un nuevo modelo de lenguaje llamado Saba, que se centra en mejorar la comprensión de las diferencias lingüísticas y culturales en Oriente Medio y el Sudeste Asiático.

El modelo Saba tiene 24 mil millones de parámetros. Aunque es más pequeño que muchos de sus competidores, Mistral AI afirma que ofrece mayor velocidad y menor coste sin sacrificar la precisión. Su arquitectura podría ser similar a la del modelo Mistral Small3. Saba puede funcionar de manera eficiente en sistemas de bajo rendimiento, incluso alcanzando velocidades superiores a 150 tokens por segundo en una configuración de una sola GPU.

QQ20250218-091928.png

Este modelo destaca especialmente en el procesamiento del árabe y el hindi, incluyendo idiomas del sur de la India como el tamil y el malayalam. Las pruebas de referencia de Mistral AI muestran que Saba ofrece un rendimiento excelente en árabe, manteniendo al mismo tiempo una capacidad comparable a la del inglés.

Saba ya se ha aplicado en escenarios reales, incluyendo asistentes virtuales en árabe y herramientas especializadas para los sectores de energía, mercados financieros y atención médica. Su comprensión de los modismos y referencias culturales locales le permite generar contenido específico de la región de manera eficaz.

Los usuarios pueden acceder a Saba a través de una API de pago o mediante implementación local. Al igual que otros modelos de Mistral AI, Saba no es de código abierto.

QQ20250218-091823.png

Las pruebas de referencia de Mistral muestran que Saba ofrece un rendimiento excelente en árabe, manteniendo al mismo tiempo una capacidad comparable a la del inglés | Fuente: Mistral AI

El lanzamiento de Saba refleja la creciente atención en el campo de la IA hacia la necesidad de modelos de lenguaje específicos para regiones determinadas. Otras organizaciones, como el proyecto OpenGPT-X (que lanzó el modelo Teuken-7B), OpenAI (que desarrolló un modelo GPT-4 específico para japonés) y el proyecto EuroLingua (centrado en las lenguas europeas) también están llevando a cabo investigaciones similares.

Los modelos de lenguaje grandes tradicionales se entrenan principalmente con grandes conjuntos de datos de texto en inglés, lo que puede provocar que se pasen por alto las sutilezas de idiomas específicos. Saba tiene como objetivo llenar este vacío, ofreciendo una capacidad de procesamiento del lenguaje más precisa y acorde con el contexto cultural local.