DocLayout-YOLO

通过多样化合成数据和全局到局部自适应感知增强文档布局分析

普通产品图像文档布局分析深度学习
DocLayout-YOLO是一个用于文档布局分析的深度学习模型,它通过多样化的合成数据和全局到局部自适应感知来增强文档布局分析的准确性和处理速度。该模型通过Mesh-candidate BestFit算法生成大规模多样化的DocSynth-300K数据集,显著提升了不同文档类型在微调性能上的表现。此外,它还提出了一个全局到局部可控的感受野模块,更好地处理文档元素的多尺度变化。DocLayout-YOLO在各种文档类型上的下游数据集上表现出色,无论是在速度还是准确性上都有显著优势。
打开网站

DocLayout-YOLO 最新流量情况

月总访问量

494758773

跳出率

37.69%

平均页面访问数

5.7

平均访问时长

00:06:29

DocLayout-YOLO 访问量趋势

DocLayout-YOLO 访问地理位置分布

DocLayout-YOLO 流量来源

DocLayout-YOLO 替代品