地質科学の分野において、地質図は地球の表面および地下構造を理解するための重要なツールです。しかし、これらの複雑な図表を解釈するには、専門知識と豊富な経験が必要です。この分野の知能化レベルを向上させるため、マイクロソフトアジア研究院は最近、地質図の理解におけるマルチモーダル大規模言語モデル(MLLM)の性能を評価するための新しいベンチマークセット、GeoMap-Benchを発表しました。
GeoMap-Benchの発表は、地質図解釈における人工知能の応用が重要な一歩を踏み出したことを意味します。マイクロソフトの研究者たちは、中国地質科学院および武漢大学の専門家と深く議論し、地質図の理解に必要な5つの重要な能力、すなわち情報抽出、位置特定、指示参照、推論、分析を特定しました。これらの能力は、基本的な情報の取得から複雑な論理タスクの実行まで、複数の側面を網羅しており、AIが地質図を包括的に理解できるようにします。
研究者たちは7000枚以上の地質図を使用してGeoMap-Benchを作成し、3000以上の標準解答付きの問題を生成することで、既存のマルチモーダル大規模モデルの地質図解釈における限界を評価しました。一般的な課題としては、高解像度画像の処理、専門分野の知識の必要性、多様な視覚表現などが挙げられます。
地質図のインテリジェントな解析をさらに推進するために、マイクロソフトはGeoMap-Agentも開発しました。このインテリジェントエージェントは、地質図のデジタル化機能を備えているだけでなく、高解像度画像処理と専門知識の適用においても著しい改善が図られています。GeoMap-Agentのアーキテクチャは、階層的情報抽出、専門知識の注入、強化されたプロンプト応答という3つのコアモジュールで構成されており、これらのモジュールの組み合わせにより、AIは複雑な地質情報を効率的かつ正確に分析できます。
研究者たちは、GeoMap-BenchとGeoMap-Agentの発表が、地質学分野におけるAIの応用に新たな研究基盤を提供するだけでなく、地質情報のデジタル化と知能化を大きく推進し、災害警報や資源探査など、より広範な分野に大きな影響を与えるだろうと述べています。