InternVL2_5-4B

Modelo de lenguaje grande multimodal que integra la comprensión visual y lingüística.

Producto ComúnImagenMultimodalModelo de lenguaje grande
InternVL2_5-4B es un modelo de lenguaje grande multimodal (MLLM) avanzado. Se basa en InternVL 2.0, manteniendo la arquitectura del modelo central pero con mejoras significativas en las estrategias de entrenamiento y prueba, así como en la calidad de los datos. El modelo destaca en el procesamiento de imágenes y tareas de texto a texto, especialmente en el razonamiento multimodal, resolución de problemas matemáticos, OCR, comprensión de gráficos y documentos. Como modelo de código abierto, proporciona a investigadores y desarrolladores herramientas potentes para explorar y construir aplicaciones inteligentes basadas en visión y lenguaje.
Abrir sitio web

InternVL2_5-4B Situación del tráfico más reciente

Total de visitas mensuales

29742941

Tasa de rebote

44.20%

Páginas promedio por visita

5.9

Duración promedio de la visita

00:04:44

InternVL2_5-4B Tendencia de visitas

InternVL2_5-4B Distribución geográfica de las visitas

InternVL2_5-4B Fuentes de tráfico

InternVL2_5-4B Alternativas