SpatialVLM

Capacita modelos de linguagem visual com raciocínio espacial

Produto ComumProdutividadeModelo de linguagem visualRaciocínio espacial
SpatialVLM é um modelo de linguagem visual desenvolvido pelo Google DeepMind, capaz de compreender e raciocinar sobre relações espaciais. Treinado em um vasto conjunto de dados sintéticos, ele adquiriu a capacidade de realizar inferências espaciais quantitativas de forma intuitiva, semelhante à dos humanos. Isso não apenas melhora seu desempenho em tarefas de VQA espacial, mas também abre novas possibilidades para tarefas downstream, como raciocínio espacial em cadeia e controle robótico.
Abrir Site

SpatialVLM Situação do Tráfego Mais Recente

Total de Visitas Mensais

2887

Taxa de Rejeição

56.57%

Média de Páginas por Visita

1.2

Duração Média da Visita

00:00:32

SpatialVLM Tendência de Visitas

SpatialVLM Distribuição Geográfica das Visitas

SpatialVLM Fontes de Tráfego

SpatialVLM Alternativas