Depth Anything
Liberando o poder de dados não rotulados em larga escala
Seleção NacionalImagemEstimativa de profundidadeProcessamento de imagem
Depth Anything é uma solução altamente prática para estimativa de profundidade monocular robusta. Nosso objetivo é construir um modelo básico simples e poderoso que processe qualquer imagem em qualquer situação, sem buscar módulos tecnológicos inovadores. Para isso, expandimos o conjunto de dados por meio de um mecanismo de processamento de dados, coletando e anotando automaticamente dados não rotulados em larga escala (cerca de 62 milhões), aumentando significativamente a cobertura dos dados e, consequentemente, reduzindo o erro de generalização. Investigamos duas estratégias simples e eficazes que tornam a expansão de dados promissora. Primeiro, criamos objetivos de otimização mais desafiadores por meio do uso de ferramentas de aumento de dados. Isso força o modelo a buscar ativamente conhecimento visual adicional e obter uma representação robusta. Segundo, desenvolvemos supervisão auxiliar para forçar o modelo a herdar ricos priors semânticos de um codificador pré-treinado. Avaliamos extensivamente sua capacidade zero-shot, incluindo seis conjuntos de dados públicos e fotos tiradas aleatoriamente. Ele demonstra uma capacidade de generalização impressionante. Além disso, ao ajustá-lo fino com informações de profundidade métricas do NYUv2 e KITTI, estabelecemos novos SOTAs. Nosso melhor modelo de profundidade também resulta em um melhor ControlNet condicionado à profundidade. Nosso modelo está disponível em https://github.com/LiheYoung/Depth-Anything.
Depth Anything Situação do Tráfego Mais Recente
Total de Visitas Mensais
4912
Taxa de Rejeição
55.70%
Média de Páginas por Visita
1.2
Duração Média da Visita
00:00:00