DocGraphLM
信息提取与问题解答的文档图语言模型
普通产品生产力信息提取问题解答
DocGraphLM是一种用于信息提取和问题解答的文档图语言模型。它采用了先进的视觉丰富文档理解技术,结合了预训练语言模型和图形语义。其独特之处在于提出了联合编码器架构来表示文档,并采用了一种新颖的链接预测方法来重构文档图。DocGraphLM通过收敛的联合损失函数预测节点之间的方向和距离,优先考虑邻域恢复并降低远程节点检测的权重。在三个SotA数据集上的实验表明,采用图形特征能够在信息提取和问题解答任务上实现一致的改进。此外,我们还报告说,采用图形特征能够加速训练过程中的收敛,尽管这些特征仅通过链接预测构建。
DocGraphLM 最新流量情况
月总访问量
17788201
跳出率
44.87%
平均页面访问数
5.4
平均访问时长
00:05:32