SpatialLM é um grande modelo de linguagem projetado para processar dados de nuvem de pontos 3D, capaz de gerar saídas estruturadas de compreensão de cena 3D, incluindo elementos arquitetônicos e categorias semânticas de objetos. Ele pode processar dados de nuvem de pontos de várias fontes, como sequências de vídeo monoculares, imagens RGBD e sensores LiDAR, sem a necessidade de equipamentos especializados. O SpatialLM tem um valor de aplicação significativo em tarefas de navegação autônoma e análise de cenas 3D complexas, melhorando significativamente a capacidade de raciocínio espacial.