Pixtral 12B es un modelo de IA multimodal desarrollado por el equipo de Mistral AI, capaz de comprender imágenes y documentos naturales, con una excelente capacidad de procesamiento de tareas multimodales y manteniendo un rendimiento de vanguardia en pruebas de referencia de texto. Este modelo admite varios tamaños y relaciones de aspecto de imagen, puede procesar cualquier cantidad de imágenes en una ventana de contexto largo, es una versión mejorada de Mistral Nemo 12B, diseñada específicamente para la inferencia multimodal sin sacrificar la capacidad clave de procesamiento de texto.