CogVLM
Poderoso modelo de lenguaje visual de código abierto
Producto ComúnImagenModelo de lenguaje visualDescripción de imágenes
CogVLM es un potente modelo de lenguaje visual de código abierto. CogVLM-17B cuenta con 10.000 millones de parámetros visuales y 7.000 millones de parámetros lingüísticos. CogVLM-17B ha alcanzado un rendimiento de vanguardia en 10 conjuntos de datos de evaluación clásicos de modalidades cruzadas, incluyendo NoCaps, subtitulación Flicker30k, RefCOCO, RefCOCO+, RefCOCOg, Visual7W, GQA, ScienceQA, VizWiz VQA y TDIUC, y ocupa el segundo lugar en VQAv2, OKVQA, TextVQA y subtitulación COCO, superando o igualando a PaLI-X 55B. CogVLM también puede conversar contigo sobre imágenes.
CogVLM Situación del tráfico más reciente
Total de visitas mensuales
474564576
Tasa de rebote
36.20%
Páginas promedio por visita
6.1
Duración promedio de la visita
00:06:34