moondream

一款强大的小型视觉语言模型,无处不在

普通产品图像视觉语言模型
moondream是一个使用SigLIP、Phi-1.5和LLaVA训练数据集构建的16亿参数模型。由于使用了LLaVA数据集,权重受CC-BY-SA许可证保护。您可以在Huggingface Spaces上尝试使用它。该模型在VQAv2、GQA、VizWiz和TextVQA基准测试中表现如下:LLaVA-1.5(13.3B参数):80.0、63.3、53.6、61.3;LLaVA-1.5(7.3B参数):78.5、62.0、50.0、58.2;MC-LLaVA-3B(3B参数):64.2、49.6、24.9、38.6;LLaVA-Phi(3B参数):71.4、-、35.9、48.6;moondream1(1.6B参数):74.3、56.3、30.3、39.8。
打开网站

moondream 最新流量情况

月总访问量

488643166

跳出率

37.28%

平均页面访问数

5.7

平均访问时长

00:06:37

moondream 访问量趋势

moondream 访问地理位置分布

moondream 流量来源

moondream 替代品