InternVL2_5-8B-MPO-AWQ
Modelo de lenguaje grande multimodal que mejora la interacción entre la visión y el lenguaje.
Producto ComúnImagenMultimodalModelo de lenguaje grande
InternVL2_5-8B-MPO-AWQ es un modelo de lenguaje grande multimodal lanzado por OpenGVLab, basado en la serie InternVL2.5 y que utiliza la técnica de optimización de preferencias mixtas (Mixed Preference Optimization, MPO). Este modelo demuestra un rendimiento excepcional en la comprensión y generación de visión y lenguaje, especialmente en tareas multimodales. Combina InternViT (parte visual) con InternLM o Qwen (parte lingüística), utilizando un proyector MLP de inicialización aleatoria para el entrenamiento incremental, logrando una comprensión e interacción profunda entre imágenes y texto. La importancia de esta técnica radica en su capacidad para procesar diversos tipos de datos, incluyendo imágenes individuales, múltiples imágenes y datos de video, ofreciendo nuevas soluciones para el campo de la inteligencia artificial multimodal.
InternVL2_5-8B-MPO-AWQ Situación del tráfico más reciente
Total de visitas mensuales
29742941
Tasa de rebote
44.20%
Páginas promedio por visita
5.9
Duración promedio de la visita
00:04:44