Pixtral-Large-Instruct-2411 é um modelo de linguagem grande multimodais com 124 bilhões de parâmetros, desenvolvido pela Mistral AI. Construído com base no Mistral Large 2, ele demonstra capacidades de compreensão de imagem de ponta. O modelo não apenas compreende documentos, gráficos e imagens naturais, mas também mantém a posição de liderança do Mistral Large 2 na compreensão de texto. Ele alcançou desempenho de ponta em datasets como MathVista, DocVQA e VQAv2, sendo uma ferramenta poderosa para aplicações de pesquisa e comerciais.