站长之家(ChinaZ.com)6月22日 消息:腾讯云最近推出了大模型知识引擎,这是一个能够快速搭建知识服务小助手的工具。它特别擅长处理复杂的PDF文档,包括行业报告、会议PPT、课本、说明书、合同单据和学术论文等,这些文档往往包含文字、图像和表格,格式复杂,对传统OCR技术来说是个挑战。

微信截图_20240622104006.png

腾讯云大模型知识引擎采用腾讯优图实验室自研的多模态文档解析大模型,通过版面分析定位文档内容的位置和类型,然后进行精准识别,并按人类阅读顺序输出连贯可读的内容。它能够理解并处理复杂的版面元素,如表格和公式,甚至能够推理并对表格数据和结构进行正确复原,极大提高了识别准确率。

此外,知识引擎还支持20多种语言和繁体字、生僻字等,能够将图片和PDF文档转换为Markdown格式输出,为大模型训练提供结构化数据源,提高模型的泛化能力和适应性。目前,文档解析功能的准确率可达98%以上,已经在多个产品上线,并提供标准化API服务。

体验地址:https://ocrdemo.cloud.tencent.com/