Pixtral-Large-Instruct-2411 est un grand modèle multimodal de 124 milliards de paramètres développé par Mistral AI, basé sur Mistral Large 2. Il affiche des capacités de compréhension d'images de pointe. Ce modèle est capable de comprendre non seulement les documents, les graphiques et les images naturelles, mais il conserve également la position de leader de Mistral Large 2 en matière de compréhension de texte. Il a atteint des performances de pointe sur des ensembles de données tels que MathVista, DocVQA et VQAv2, ce qui en fait un outil puissant pour la recherche et les applications commerciales.