InternVL 2.5 es una serie de modelos de lenguaje grandes multimodales lanzada por OpenGVLab. Se basa en InternVL 2.0, con mejoras significativas en las estrategias de entrenamiento y prueba, así como en la calidad de los datos. Esta serie de modelos puede procesar datos de imagen, texto y vídeo, y posee la capacidad de comprensión y generación multimodales, representando un producto de vanguardia en el campo de la inteligencia artificial multimodal. La serie de modelos InternVL 2.5, gracias a su alto rendimiento y características de código abierto, ofrece un potente soporte para tareas multimodales.