DocLayout-YOLOは文書レイアウト解析のための深層学習モデルです。多様な合成データとグローバルからローカルへの適応的知覚によって、文書レイアウト解析の精度と処理速度を向上させます。Mesh-candidate BestFitアルゴリズムを用いて大規模で多様なDocSynth-300Kデータセットを生成することで、様々な文書タイプにおける微調整性能を大幅に向上させました。さらに、グローバルからローカルまで制御可能な感受野モジュールを提案し、文書要素の多様なスケール変化をより適切に処理します。DocLayout-YOLOは様々な文書タイプの下流データセットにおいて優れた性能を示し、速度と精度において顕著な利点があります。