PixelProse

大规模图像描述数据集,提供超过16M的合成图像描述。

普通产品其他图像描述视觉-语言模型
PixelProse是一个由tomg-group-umd创建的大规模数据集,它利用先进的视觉-语言模型Gemini 1.0 Pro Vision生成了超过1600万个详细的图像描述。这个数据集对于开发和改进图像到文本的转换技术具有重要意义,可以用于图像描述生成、视觉问答等任务。
打开网站

PixelProse 最新流量情况

月总访问量

17788201

跳出率

44.87%

平均页面访问数

5.4

平均访问时长

00:05:32

PixelProse 访问量趋势

PixelProse 访问地理位置分布

PixelProse 流量来源

PixelProse 替代品