ODIN-Modell

Ein einziges Modell für die 2D- und 3D-Wahrnehmung

Normales ProduktBildComputer VisionInstanzsegmentierung
ODIN (Omni-Dimensional INstance segmentation) ist ein Modell, das mithilfe der Transformer-Architektur Segmentierungs- und Markierungsaufgaben auf 2D-RGB-Bildern und 3D-Punktwolken durchführen kann. Es unterscheidet 2D- und 3D-Feature-Operationen durch die abwechselnde Fusion von Informationen innerhalb der 2D- und der 3D-Ansicht. ODIN erzielt auf den ScanNet200-, Matterport3D- und AI2THOR-3D-Instanzsegmentierungs-Benchmarks state-of-the-art-Ergebnisse und liefert auf ScanNet, S3DIS und COCO wettbewerbsfähige Leistungen. Es übertrifft alle bisherigen Arbeiten, wenn anstelle von wahrgenommenen 3D-Punktwolken abgetastete Punktwolken aus 3D-Netzen verwendet werden. Als 3D-Wahrnehmungs-Engine in einer verwendbaren, agentenbasierten Architektur setzt es neue Maßstäbe beim TEACh-Dialogaktions-Benchmark. Unser Code und unsere Checkpoints sind auf der Projektwebsite verfügbar.
Website öffnen

ODIN-Modell Neueste Verkehrssituation

Monatliche Gesamtbesuche

29742941

Absprungrate

44.20%

Durchschnittliche Seiten pro Besuch

5.9

Durchschnittliche Besuchsdauer

00:04:44

ODIN-Modell Besuchstrend

ODIN-Modell Geografische Verteilung der Besuche

ODIN-Modell Traffic-Quellen

ODIN-Modell Alternativen