CogVLM

强大的开源视觉语言模型

普通产品图像视觉语言模型图像描述
CogVLM是一个强大的开源视觉语言模型。CogVLM-17B拥有100亿个视觉参数和70亿个语言参数。CogVLM-17B在10个经典的跨模态基准测试中取得了最先进的性能,包括NoCaps、Flicker30k字幕、RefCOCO、RefCOCO+、RefCOCOg、Visual7W、GQA、ScienceQA、VizWiz VQA和TDIUC,并在VQAv2、OKVQA、TextVQA、COCO字幕等方面排名第二,超过或与PaLI-X 55B相匹配。CogVLM还可以与您就图像进行对话。
打开网站

CogVLM 最新流量情况

月总访问量

488643166

跳出率

37.28%

平均页面访问数

5.7

平均访问时长

00:06:37

CogVLM 访问量趋势

CogVLM 访问地理位置分布

CogVLM 流量来源

CogVLM 替代品