Modèle ODIN
Modèle unique pour la perception 2D et 3D
Produit OrdinaireImageVision par ordinateurSegmentation d'instances
ODIN (Omni-Dimensional INstance segmentation) est un modèle utilisant une architecture de transformateur pour la segmentation et l'annotation d'images RGB 2D et de nuages de points 3D. Il différencie les opérations sur les caractéristiques 2D et 3D en fusionnant alternativement les informations à l'intérieur des vues 2D et entre les vues 2D et 3D. ODIN atteint des performances de pointe sur les benchmarks de segmentation d'instances ScanNet200, Matterport3D et AI2THOR 3D, et des performances compétitives sur ScanNet, S3DIS et COCO. Il surpasse tous les travaux précédents lorsqu'un nuage de points échantillonné à partir d'un maillage 3D est utilisé au lieu d'un nuage de points 3D perçu. Intégré comme moteur de perception 3D dans une architecture d'agent incarné guidé, il établit un nouveau niveau de performance de pointe sur le benchmark d'actions conversationnelles TEACh. Notre code et nos points de contrôle sont disponibles sur le site web du projet.
Modèle ODIN Dernière situation du trafic
Nombre total de visites mensuelles
29742941
Taux de rebond
44.20%
Nombre moyen de pages par visite
5.9
Durée moyenne de la visite
00:04:44