Florence-2-large

先进的视觉基础模型,支持多种视觉和视觉-语言任务

普通产品图像视觉模型多任务学习
Florence-2-large是由微软开发的先进视觉基础模型,采用基于提示的方法处理广泛的视觉和视觉-语言任务。该模型能够解释简单的文本提示来执行如图像描述、目标检测和分割等任务。它利用包含54亿注释的5.4亿图像的FLD-5B数据集,精通多任务学习。其序列到序列的架构使其在零样本和微调设置中均表现出色,证明是一个有竞争力的视觉基础模型。
打开网站

Florence-2-large 最新流量情况

月总访问量

17788201

跳出率

44.87%

平均页面访问数

5.4

平均访问时长

00:05:32

Florence-2-large 访问量趋势

Florence-2-large 访问地理位置分布

Florence-2-large 流量来源

Florence-2-large 替代品