DocLayout-YOLO
多様な合成データとグローバルからローカルへの適応的知覚向上により文書レイアウト解析を強化
一般製品画像文書レイアウト解析深層学習
DocLayout-YOLOは文書レイアウト解析のための深層学習モデルです。多様な合成データとグローバルからローカルへの適応的知覚によって、文書レイアウト解析の精度と処理速度を向上させます。Mesh-candidate BestFitアルゴリズムを用いて大規模で多様なDocSynth-300Kデータセットを生成することで、様々な文書タイプにおける微調整性能を大幅に向上させました。さらに、グローバルからローカルまで制御可能な感受野モジュールを提案し、文書要素の多様なスケール変化をより適切に処理します。DocLayout-YOLOは様々な文書タイプの下流データセットにおいて優れた性能を示し、速度と精度において顕著な利点があります。
DocLayout-YOLO 最新のトラフィック状況
月間総訪問数
474564576
直帰率
36.20%
平均ページ/訪問
6.1
平均訪問時間
00:06:34