DocLayout-YOLO

多様な合成データとグローバルからローカルへの適応的知覚向上により文書レイアウト解析を強化

一般製品画像文書レイアウト解析深層学習
DocLayout-YOLOは文書レイアウト解析のための深層学習モデルです。多様な合成データとグローバルからローカルへの適応的知覚によって、文書レイアウト解析の精度と処理速度を向上させます。Mesh-candidate BestFitアルゴリズムを用いて大規模で多様なDocSynth-300Kデータセットを生成することで、様々な文書タイプにおける微調整性能を大幅に向上させました。さらに、グローバルからローカルまで制御可能な感受野モジュールを提案し、文書要素の多様なスケール変化をより適切に処理します。DocLayout-YOLOは様々な文書タイプの下流データセットにおいて優れた性能を示し、速度と精度において顕著な利点があります。
ウェブサイトを開く

DocLayout-YOLO 最新のトラフィック状況

月間総訪問数

474564576

直帰率

36.20%

平均ページ/訪問

6.1

平均訪問時間

00:06:34

DocLayout-YOLO 訪問数の傾向

DocLayout-YOLO 訪問地理的分布

DocLayout-YOLO トラフィックソース

DocLayout-YOLO 代替品