InternVL2_5-2B-MPO es una serie de modelos de lenguaje grandes multimodales que exhiben un rendimiento general excepcional. Esta serie se basa en InternVL2.5 y la optimización de preferencias mixtas. Integra InternViT, preentrenado incrementalmente, con varios modelos de lenguaje grandes preentrenados, incluyendo InternLM 2.5 y Qwen 2.5, utilizando proyectores MLP con inicialización aleatoria. El modelo destaca en tareas multimodales, capaz de procesar varios tipos de datos, incluyendo imágenes y texto, siendo adecuado para escenarios que requieren comprensión y generación de contenido multimodal.