SpatialLM est un grand modèle linguistique conçu pour traiter les données de nuages de points 3D. Il est capable de générer une sortie structurée de compréhension de scènes 3D, incluant les éléments architecturaux et les catégories sémantiques des objets. Il peut traiter les données de nuages de points provenant de sources diverses, telles que les séquences vidéo monoculaires, les images RGBD et les capteurs LiDAR, sans nécessiter d'équipement spécialisé. SpatialLM a une valeur applicative importante dans les tâches de navigation autonome et d'analyse de scènes 3D complexes, améliorant considérablement les capacités de raisonnement spatial.