Vision Mamba
Marco de aprendizaje eficiente de representaciones visuales basado en un modelo de espacio de estados bidireccional.
Producto ComúnImagenVisión por computadorAprendizaje profundo
Vision Mamba es un marco de aprendizaje de representaciones visuales eficiente, construido con módulos Mamba bidireccionales, que puede superar las limitaciones de cálculo y memoria para la comprensión de imágenes de alta resolución al estilo Transformer. No depende del mecanismo de autoatención; comprime las representaciones visuales mediante incrustaciones de posición y un modelo de espacio de estados bidireccional, logrando un rendimiento superior y una mayor eficiencia en el cálculo y la memoria. Este marco supera en rendimiento a los Transformers visuales clásicos, como DeiT, en las tareas de clasificación de ImageNet, detección de objetos COCO y segmentación semántica ADE20k, con una mejora de 2,8 veces en la eficiencia de cálculo y de 86,8% en la eficiencia de memoria.
Vision Mamba Situación del tráfico más reciente
Total de visitas mensuales
474564576
Tasa de rebote
36.20%
Páginas promedio por visita
6.1
Duración promedio de la visita
00:06:34