CogVLM

Poderoso modelo de lenguaje visual de código abierto

Producto ComúnImagenModelo de lenguaje visualDescripción de imágenes
CogVLM es un potente modelo de lenguaje visual de código abierto. CogVLM-17B cuenta con 10.000 millones de parámetros visuales y 7.000 millones de parámetros lingüísticos. CogVLM-17B ha alcanzado un rendimiento de vanguardia en 10 conjuntos de datos de evaluación clásicos de modalidades cruzadas, incluyendo NoCaps, subtitulación Flicker30k, RefCOCO, RefCOCO+, RefCOCOg, Visual7W, GQA, ScienceQA, VizWiz VQA y TDIUC, y ocupa el segundo lugar en VQAv2, OKVQA, TextVQA y subtitulación COCO, superando o igualando a PaLI-X 55B. CogVLM también puede conversar contigo sobre imágenes.
Abrir sitio web

CogVLM Situación del tráfico más reciente

Total de visitas mensuales

474564576

Tasa de rebote

36.20%

Páginas promedio por visita

6.1

Duración promedio de la visita

00:06:34

CogVLM Tendencia de visitas

CogVLM Distribución geográfica de las visitas

CogVLM Fuentes de tráfico

CogVLM Alternativas