Pixtral-Large-Instruct-2411 es un modelo multimodal grande de 124B parámetros desarrollado por Mistral AI, basado en Mistral Large 2, que demuestra capacidades de comprensión de imágenes de vanguardia. El modelo no solo comprende documentos, gráficos e imágenes naturales, sino que también mantiene la posición de liderazgo de Mistral Large 2 en la comprensión de texto. Ha alcanzado el rendimiento más avanzado en conjuntos de datos como MathVista, DocVQA y VQAv2, convirtiéndose en una poderosa herramienta para la investigación y aplicaciones comerciales.