ODIN-Modell
Ein einziges Modell für die 2D- und 3D-Wahrnehmung
Normales ProduktBildComputer VisionInstanzsegmentierung
ODIN (Omni-Dimensional INstance segmentation) ist ein Modell, das mithilfe der Transformer-Architektur Segmentierungs- und Markierungsaufgaben auf 2D-RGB-Bildern und 3D-Punktwolken durchführen kann. Es unterscheidet 2D- und 3D-Feature-Operationen durch die abwechselnde Fusion von Informationen innerhalb der 2D- und der 3D-Ansicht. ODIN erzielt auf den ScanNet200-, Matterport3D- und AI2THOR-3D-Instanzsegmentierungs-Benchmarks state-of-the-art-Ergebnisse und liefert auf ScanNet, S3DIS und COCO wettbewerbsfähige Leistungen. Es übertrifft alle bisherigen Arbeiten, wenn anstelle von wahrgenommenen 3D-Punktwolken abgetastete Punktwolken aus 3D-Netzen verwendet werden. Als 3D-Wahrnehmungs-Engine in einer verwendbaren, agentenbasierten Architektur setzt es neue Maßstäbe beim TEACh-Dialogaktions-Benchmark. Unser Code und unsere Checkpoints sind auf der Projektwebsite verfügbar.
ODIN-Modell Neueste Verkehrssituation
Monatliche Gesamtbesuche
29742941
Absprungrate
44.20%
Durchschnittliche Seiten pro Besuch
5.9
Durchschnittliche Besuchsdauer
00:04:44