在地质科学领域,地质图是理解地球表面及地下结构的关键工具。然而,解读这些复杂的图表需要专业知识和丰富的经验。为了提升这一领域的智能化水平,微软亚洲研究院近日推出了一个新基准集 GeoMap-Bench,专门用于评估多模态大语言模型(MLLMs)在地质图理解方面的表现。
GeoMap-Bench 的推出标志着地质图解读的人工智能应用迈出了重要一步。微软研究人员与中国地质科学院及武汉大学的专家深入探讨,确定了地质图理解所需的五大关键能力:信息提取、定位、指代、推理和分析。这些能力涵盖了从获取基本信息到执行复杂逻辑任务的多个方面,确保 AI 能够全面理解地质图。
研究人员利用超过7000幅地质图创建了 GeoMap-Bench,生成了3000多个带有标准答案的问题,以此评估现有的多模态大模型在地质图解读中的局限性。常见的挑战包括高分辨率图像的处理、专业领域知识的需求,以及多样化的视觉表现。
为了进一步推动地质图的智能解析,微软还研发了 GeoMap-Agent,这一智能体不仅具备数字化地质图的能力,还在高分辨率图像处理和领域知识应用上进行了显著改进。GeoMap-Agent 的架构包含三个核心模块:层级信息提取、领域知识注入和增强提示问答,这些模块的结合使得 AI 能够高效、准确地分析复杂的地质信息。
研究人员表示,GeoMap-Bench 和 GeoMap-Agent 的推出,不仅为地质学领域的 AI 应用提供了新的研究基础,也将极大地推动地质信息的数字化和智能化,为更广泛的领域如灾害预警和资源勘探等带来深远影响。