Dans le domaine des sciences géologiques, les cartes géologiques sont des outils essentiels pour comprendre la structure de la surface terrestre et du sous-sol. Cependant, l'interprétation de ces diagrammes complexes nécessite des connaissances spécialisées et une expérience approfondie. Pour améliorer l'intelligence dans ce domaine, les Microsoft Research Asia ont récemment lancé un nouveau jeu de données de référence, GeoMap-Bench, spécialement conçu pour évaluer les performances des modèles linguistiques multimodaux (MLLM) dans la compréhension des cartes géologiques.

Le lancement de GeoMap-Bench marque une étape importante dans l'application de l'intelligence artificielle à l'interprétation des cartes géologiques. Les chercheurs de Microsoft, en collaboration avec des experts de l'Institut des Géosciences de Chine et de l'Université de Wuhan, ont identifié cinq capacités clés nécessaires à la compréhension des cartes géologiques : l'extraction d'informations, la localisation, la référence, le raisonnement et l'analyse. Ces capacités couvrent de nombreux aspects, de l'acquisition d'informations de base à l'exécution de tâches logiques complexes, garantissant ainsi une compréhension globale des cartes géologiques par l'IA.

image.png

Les chercheurs ont utilisé plus de 7 000 cartes géologiques pour créer GeoMap-Bench, générant plus de 3 000 questions avec des réponses standardisées afin d'évaluer les limites des modèles multimodaux existants dans l'interprétation des cartes géologiques. Les défis courants incluent le traitement d'images haute résolution, la nécessité de connaissances spécialisées et la diversité des représentations visuelles.

image.png

Pour faire progresser l'analyse intelligente des cartes géologiques, Microsoft a également développé GeoMap-Agent, un agent intelligent capable non seulement de numériser les cartes géologiques, mais aussi d'améliorer considérablement le traitement d'images haute résolution et l'application de connaissances spécialisées. L'architecture de GeoMap-Agent comprend trois modules principaux : l'extraction hiérarchique d'informations, l'injection de connaissances spécialisées et l'amélioration des questions-réponses. La combinaison de ces modules permet à l'IA d'analyser efficacement et précisément des informations géologiques complexes.

Les chercheurs ont indiqué que le lancement de GeoMap-Bench et de GeoMap-Agent fournit non seulement une nouvelle base de recherche pour les applications de l'IA dans le domaine de la géologie, mais contribuera également grandement à la numérisation et à l'intelligence des informations géologiques, ayant un impact profond sur des domaines plus vastes tels que la prévention des catastrophes et l'exploration des ressources.