Vision Mamba

Marco de aprendizaje eficiente de representaciones visuales basado en un modelo de espacio de estados bidireccional.

Producto ComúnImagenVisión por computadorAprendizaje profundo
Vision Mamba es un marco de aprendizaje de representaciones visuales eficiente, construido con módulos Mamba bidireccionales, que puede superar las limitaciones de cálculo y memoria para la comprensión de imágenes de alta resolución al estilo Transformer. No depende del mecanismo de autoatención; comprime las representaciones visuales mediante incrustaciones de posición y un modelo de espacio de estados bidireccional, logrando un rendimiento superior y una mayor eficiencia en el cálculo y la memoria. Este marco supera en rendimiento a los Transformers visuales clásicos, como DeiT, en las tareas de clasificación de ImageNet, detección de objetos COCO y segmentación semántica ADE20k, con una mejora de 2,8 veces en la eficiencia de cálculo y de 86,8% en la eficiencia de memoria.
Abrir sitio web

Vision Mamba Situación del tráfico más reciente

Total de visitas mensuales

474564576

Tasa de rebote

36.20%

Páginas promedio por visita

6.1

Duración promedio de la visita

00:06:34

Vision Mamba Tendencia de visitas

Vision Mamba Distribución geográfica de las visitas

Vision Mamba Fuentes de tráfico

Vision Mamba Alternativas