DocLayout-YOLO é um modelo de aprendizado profundo para análise de layout de documentos. Ele aprimora a precisão e a velocidade de processamento da análise de layout de documentos por meio de dados sintéticos diversificados e percepção adaptativa global a local. O modelo gera um conjunto de dados DocSynth-300K em larga escala e diversificado usando o algoritmo Mesh-candidate BestFit, melhorando significativamente o desempenho de ajuste fino em diferentes tipos de documentos. Além disso, ele apresenta um módulo de campo receptivo controlável global a local para melhor lidar com as variações de escala multipla de elementos de documento. O DocLayout-YOLO apresenta desempenho excepcional em conjuntos de dados downstream de vários tipos de documentos, com vantagens significativas em termos de velocidade e precisão.