Florence-2-base-ft

先进的视觉基础模型,支持多种视觉和视觉-语言任务

普通产品图像图像处理视觉-语言模型
Florence-2是由微软开发的高级视觉基础模型,采用基于提示的方法处理广泛的视觉和视觉-语言任务。该模型能够解释简单的文本提示,执行诸如图像描述、目标检测和分割等任务。它利用FLD-5B数据集,包含54亿个注释,覆盖1.26亿张图像,精通多任务学习。其序列到序列的架构使其在零样本和微调设置中均表现出色,证明是一个有竞争力的视觉基础模型。
打开网站

Florence-2-base-ft 最新流量情况

月总访问量

17788201

跳出率

44.87%

平均页面访问数

5.4

平均访问时长

00:05:32

Florence-2-base-ft 访问量趋势

Florence-2-base-ft 访问地理位置分布

Florence-2-base-ft 流量来源

Florence-2-base-ft 替代品