InternVL2_5-8B-MPO-AWQ

Modelo de lenguaje grande multimodal que mejora la interacción entre la visión y el lenguaje.

Producto ComúnImagenMultimodalModelo de lenguaje grande
InternVL2_5-8B-MPO-AWQ es un modelo de lenguaje grande multimodal lanzado por OpenGVLab, basado en la serie InternVL2.5 y que utiliza la técnica de optimización de preferencias mixtas (Mixed Preference Optimization, MPO). Este modelo demuestra un rendimiento excepcional en la comprensión y generación de visión y lenguaje, especialmente en tareas multimodales. Combina InternViT (parte visual) con InternLM o Qwen (parte lingüística), utilizando un proyector MLP de inicialización aleatoria para el entrenamiento incremental, logrando una comprensión e interacción profunda entre imágenes y texto. La importancia de esta técnica radica en su capacidad para procesar diversos tipos de datos, incluyendo imágenes individuales, múltiples imágenes y datos de video, ofreciendo nuevas soluciones para el campo de la inteligencia artificial multimodal.
Abrir sitio web

InternVL2_5-8B-MPO-AWQ Situación del tráfico más reciente

Total de visitas mensuales

29742941

Tasa de rebote

44.20%

Páginas promedio por visita

5.9

Duración promedio de la visita

00:04:44

InternVL2_5-8B-MPO-AWQ Tendencia de visitas

InternVL2_5-8B-MPO-AWQ Distribución geográfica de las visitas

InternVL2_5-8B-MPO-AWQ Fuentes de tráfico

InternVL2_5-8B-MPO-AWQ Alternativas