Mistral AI acaba de anunciar el lanzamiento de su modelo de lenguaje grande de última generación, Mistral Large2, que supone un avance significativo en cuanto a rentabilidad, velocidad y rendimiento.

Resumen del modelo

Mistral Large2 es un modelo con 123 mil millones de parámetros y una ventana de contexto de 128K. Admite docenas de idiomas, incluyendo inglés, francés, alemán, español, italiano, portugués, árabe, hindi, ruso, chino, japonés y coreano, así como más de 80 lenguajes de programación como Python, Java, C, C++, JavaScript y Bash.

Puntos destacados del rendimiento

QQ_1721867063415.png

Rendimiento general: En la prueba MMLU, la versión preentrenada de Mistral Large2 alcanzó una precisión del 84,0%.

QQ_1721867086970.png

QQ_1721867110778.png

Capacidad de código e inferencia: En la generación de código y el razonamiento matemático, Mistral Large2 presenta un rendimiento comparable al de modelos líderes como GPT-4, Claude3Opus y Llama3405B.

QQ_1721867130761.png

Capacidad multilingüe: En las pruebas comparativas MMLU multilingües, Mistral Large2 demuestra una excelente capacidad de procesamiento multilingüe, especialmente en idiomas principales como inglés, francés y alemán.

Seguimiento de instrucciones y alineación: En las pruebas comparativas MT-Bench, Wild Bench y Arena Hard, Mistral Large2 ha mejorado significativamente el seguimiento de instrucciones y la capacidad de diálogo.

Uso de herramientas y llamadas a funciones: El modelo ha sido entrenado para ejecutar eficientemente llamadas a funciones paralelas y secuenciales, proporcionando un sólido soporte para aplicaciones comerciales complejas.

Características técnicas

Reducción significativa del fenómeno de "alucinaciones", mejorando la fiabilidad y precisión de la salida.

Mayor capacidad de autoconciencia del modelo cuando no encuentra soluciones o información suficiente.

Énfasis en la generación de respuestas concisas y relevantes, mejorando la eficiencia de la interacción y la rentabilidad.

Aplicaciones y disponibilidad

Mistral Large2 ya está disponible en la Plateforme con el nombre "mistral-large-2407".

Los pesos del modelo están disponibles públicamente y se alojan en HuggingFace.

Mistral AI amplía su colaboración con Google Cloud Platform para ofrecer servicios de API administrados a través de Vertex AI.

El modelo también es accesible a través de proveedores de servicios en la nube como Azure AI Studio, Amazon Bedrock e IBM watsonx.ai.

Licencia y condiciones de uso

Mistral Large2 se publica bajo la licencia Mistral Research License, que permite su uso con fines de investigación y no comerciales. Para uso comercial, se requiere la licencia Mistral Commercial License.

El lanzamiento de este nuevo modelo marca un gran avance de Mistral AI en el campo de los modelos de lenguaje grandes, ofreciendo a los desarrolladores de aplicaciones de inteligencia artificial herramientas más potentes y flexibles, con el potencial de impulsar aplicaciones innovadoras en diversos sectores.