Vision Mamba

Framework de aprendizado de representação visual eficiente baseado em um modelo de espaço de estados bidirecional.

Produto ComumImagemVisão computacionalAprendizado profundo
Vision Mamba é um framework de aprendizado de representação visual eficiente, construído com módulos Mamba bidirecionais, que supera as limitações de cálculo e memória, permitindo a compreensão de imagens de alta resolução no estilo Transformer. Ele não depende de mecanismos de autoatenção, comprimindo a representação visual por meio de embeddings posicionais e um modelo de espaço de estados bidirecional, resultando em melhor desempenho, eficiência computacional e de memória. Este framework superou os Transformers visuais clássicos, como DeiT, em tarefas de classificação de ImageNet, detecção de objetos COCO e segmentação semântica ADE20k, com aumento da eficiência computacional e de memória de 2,8 vezes e 86,8%, respectivamente.
Abrir Site

Vision Mamba Situação do Tráfego Mais Recente

Total de Visitas Mensais

474564576

Taxa de Rejeição

36.20%

Média de Páginas por Visita

6.1

Duração Média da Visita

00:06:34

Vision Mamba Tendência de Visitas

Vision Mamba Distribuição Geográfica das Visitas

Vision Mamba Fontes de Tráfego

Vision Mamba Alternativas