SpatialLM एक बड़ा भाषा मॉडल है जो विशेष रूप से 3D पॉइंट क्लाउड डेटा को संसाधित करने के लिए डिज़ाइन किया गया है, जो संरचित 3D दृश्य समझ आउटपुट उत्पन्न करता है, जिसमें भवन तत्व और वस्तुओं की शब्दार्थ श्रेणी शामिल हैं। यह मोनोकुलर वीडियो अनुक्रम, RGBD छवियों और LiDAR सेंसर जैसे कई स्रोतों से पॉइंट क्लाउड डेटा को संसाधित कर सकता है, बिना किसी विशेष उपकरण की आवश्यकता के। SpatialLM स्वायत्त नेविगेशन और जटिल 3D दृश्य विश्लेषण कार्यों में महत्वपूर्ण अनुप्रयोग मूल्य रखता है, जिससे स्थानिक अनुमान क्षमता में उल्लेखनीय वृद्धि होती है।