InternVL2_5-4B
Modelo de lenguaje grande multimodal que integra la comprensión visual y lingüística.
Producto ComúnImagenMultimodalModelo de lenguaje grande
InternVL2_5-4B es un modelo de lenguaje grande multimodal (MLLM) avanzado. Se basa en InternVL 2.0, manteniendo la arquitectura del modelo central pero con mejoras significativas en las estrategias de entrenamiento y prueba, así como en la calidad de los datos. El modelo destaca en el procesamiento de imágenes y tareas de texto a texto, especialmente en el razonamiento multimodal, resolución de problemas matemáticos, OCR, comprensión de gráficos y documentos. Como modelo de código abierto, proporciona a investigadores y desarrolladores herramientas potentes para explorar y construir aplicaciones inteligentes basadas en visión y lenguaje.
InternVL2_5-4B Situación del tráfico más reciente
Total de visitas mensuales
29742941
Tasa de rebote
44.20%
Páginas promedio por visita
5.9
Duración promedio de la visita
00:04:44