SpatialLM ist ein großes Sprachmodell, das speziell für die Verarbeitung von 3D-Punktwolkendaten entwickelt wurde und strukturierte Ausgaben zum Verständnis von 3D-Szenen generieren kann, einschließlich Gebäudeelementen und semantischen Kategorien von Objekten. Es kann Punktwolkendaten aus verschiedenen Quellen verarbeiten, darunter Monokular-Videosequenzen, RGBD-Bilder und LiDAR-Sensoren, ohne spezielle Geräte zu benötigen. SpatialLM hat einen hohen Anwendungswert in der autonomen Navigation und der Analyse komplexer 3D-Szenen und verbessert die räumliche Inferenzfähigkeit deutlich.