Das Institute for Artificial Intelligence (AIR) hat kürzlich Uni3D, ein generisches 3D-Sehmodell mit 10 Milliarden Parametern, als Open Source veröffentlicht. Dieses Modell kann Punktwolken verarbeiten und hat in gängigen 3D-Sehaufgaben umfassende technologische Durchbrüche erzielt, wobei es eine außergewöhnliche generische Sehleistung demonstriert.
Das Uni3D-Entwicklungsteam hat sich von den Designprinzipien zweidimensionaler Seemodelle inspirieren lassen und eine multimodal ausgerichtete Trainingsmethode eingeführt. Dadurch kann das Modell direkt das Wissen aus zweidimensionalen Sehmdellen übernehmen und so leistungsstarke 3D-Sehfähigkeiten entwickeln.
Das Modell erzielt in verschiedenen 3D-Sehaufgaben state-of-the-art Ergebnisse und zeigt seine starke Generalisierbarkeit und Fähigkeit zum Transferlernen. Das AIR erklärt, dass die Open-Source-Veröffentlichung von Uni3D eine solide Grundlage für zukünftige Forschung und Anwendungen im Bereich der dreidimensionalen Computer Vision schafft.