InternVL2_5-2B
Modelo de lenguaje grande multimodal que admite una interacción profunda entre imágenes y texto.
Producto ComúnImagenMultimodalModelo de lenguaje grande
InternVL 2.5 es una serie de modelos de lenguaje grandes multimodales avanzados que, basándose en InternVL 2.0, mantiene su arquitectura de modelo central mediante la introducción de mejoras significativas en las estrategias de entrenamiento y prueba, así como en la calidad de los datos. El modelo integra InternViT, preentrenado con datos adicionales, con varios modelos de lenguaje grandes preentrenados, como InternLM 2.5 y Qwen 2.5, utilizando un proyector MLP inicializado aleatoriamente. InternVL 2.5 admite datos de múltiples imágenes y videos, cuenta con un método de entrenamiento dinámico de alta resolución y puede ofrecer un mejor rendimiento al procesar datos multimodales.
InternVL2_5-2B Situación del tráfico más reciente
Total de visitas mensuales
29742941
Tasa de rebote
44.20%
Páginas promedio por visita
5.9
Duración promedio de la visita
00:04:44