InternVL2_5-1B-MPO

Modelo de lenguaje grande multimodal que mejora la comprensión integral de la visión y el lenguaje.

Producto ComúnProductividadMultimodalModelo de lenguaje grande
InternVL2_5-1B-MPO es un modelo de lenguaje grande multimodal (MLLM) construido sobre InternVL2.5 y optimización de preferencias mixtas (MPO), que demuestra un rendimiento general superior. Este modelo integra InternViT con preentrenamiento incremental y varios modelos de lenguaje grandes (LLM) preentrenados, incluyendo InternLM 2.5 y Qwen 2.5, utilizando proyectores MLP con inicialización aleatoria. InternVL2_5-MPO mantiene el paradigma "ViT-MLP-LLM" en su arquitectura, igual que InternVL 2.5 y sus predecesores, e introduce soporte para datos de múltiples imágenes y videos. El modelo destaca en tareas multimodales, pudiendo gestionar diversas tareas de lenguaje visual, incluyendo descripción de imágenes y preguntas y respuestas visuales.
Abrir sitio web

InternVL2_5-1B-MPO Situación del tráfico más reciente

Total de visitas mensuales

29742941

Tasa de rebote

44.20%

Páginas promedio por visita

5.9

Duración promedio de la visita

00:04:44

InternVL2_5-1B-MPO Tendencia de visitas

InternVL2_5-1B-MPO Distribución geográfica de las visitas

InternVL2_5-1B-MPO Fuentes de tráfico

InternVL2_5-1B-MPO Alternativas