DocGraphLMは、情報抽出と質問応答のためのドキュメントグラフ言語モデルです。高度な視覚的に豊富なドキュメント理解技術を採用し、事前学習済み言語モデルとグラフ意味論を組み合わせています。その独自性は、ドキュメントを表すための統合エンコーダアーキテクチャと、ドキュメントグラフを再構築するための斬新なリンク予測手法を提案している点にあります。DocGraphLMは、収束した統合損失関数によってノード間の向きと距離を予測し、近傍の復元を優先し、遠隔ノードの検出の重みを低減します。3つのSotAデータセットにおける実験では、グラフ特徴を採用することで、情報抽出と質問応答のタスクにおいて一貫した改善が達成できることが示されました。さらに、これらの特徴はリンク予測によってのみ構築されていますが、グラフ特徴を採用することで、トレーニングプロセスの収束を加速できることも報告されています。