InternVL2_5-26B

Modelo de lenguaje grande multimodal que integra la comprensión visual y lingüística.

Producto ComúnImagenMultimodalModelo de lenguaje grande
InternVL2_5-26B es un modelo de lenguaje grande multimodal (MLLM) avanzado, desarrollado a partir de InternVL 2.0 mediante la introducción de estrategias de entrenamiento y prueba significativamente mejoradas y una mayor calidad de datos. El modelo mantiene la arquitectura principal de su predecesor, "ViT-MLP-LLM", e integra InternViT, preentrenado adicionalmente, y varios modelos de lenguaje grandes (LLM) preentrenados, como InternLM 2.5 y Qwen 2.5, utilizando un proyector MLP de inicialización aleatoria. Los modelos de la serie InternVL 2.5 muestran un rendimiento excelente en tareas multimodales, especialmente en percepción visual y capacidades multimodales.
Abrir sitio web

InternVL2_5-26B Situación del tráfico más reciente

Total de visitas mensuales

29742941

Tasa de rebote

44.20%

Páginas promedio por visita

5.9

Duración promedio de la visita

00:04:44

InternVL2_5-26B Tendencia de visitas

InternVL2_5-26B Distribución geográfica de las visitas

InternVL2_5-26B Fuentes de tráfico

InternVL2_5-26B Alternativas