Vision Mamba
Framework de aprendizado de representação visual eficiente baseado em um modelo de espaço de estados bidirecional.
Produto ComumImagemVisão computacionalAprendizado profundo
Vision Mamba é um framework de aprendizado de representação visual eficiente, construído com módulos Mamba bidirecionais, que supera as limitações de cálculo e memória, permitindo a compreensão de imagens de alta resolução no estilo Transformer. Ele não depende de mecanismos de autoatenção, comprimindo a representação visual por meio de embeddings posicionais e um modelo de espaço de estados bidirecional, resultando em melhor desempenho, eficiência computacional e de memória. Este framework superou os Transformers visuais clássicos, como DeiT, em tarefas de classificação de ImageNet, detecção de objetos COCO e segmentação semântica ADE20k, com aumento da eficiência computacional e de memória de 2,8 vezes e 86,8%, respectivamente.
Vision Mamba Situação do Tráfego Mais Recente
Total de Visitas Mensais
474564576
Taxa de Rejeição
36.20%
Média de Páginas por Visita
6.1
Duração Média da Visita
00:06:34