Ein Forschungsteam der Peking-Universität und des Pengcheng-Labors hat kürzlich HoloDreamer vorgestellt, ein neuartiges Framework zur 3D-Szenerie-Generierung. Es erzeugt mithilfe von Textbeschreibungen immersive und vollständige 3D-Szenen.

Das Framework besteht aus zwei Kernmodulen: Erstens die „stilisierte isometrische Panorama-Generierung“, die auf Basis von Nutzerhinweisen hochwertige Panoramen erstellt; zweitens die „verbesserte zweistufige Panorama-Rekonstruktion“, die mittels 3D-Gauß-Sprühen eine schnelle Rekonstruktion des Panoramas ermöglicht und die Konsistenz der Perspektive gewährleistet.

image.png

Projektseite: https://top.aibase.com/tool/holodreamer

In der virtuellen Realität, der Spiele- und Filmindustrie steigt der Bedarf an 3D-Szenerie-Generierung stetig. Dank leistungsstarker Text-zu-Bild-Diffusionsmodelle ist die Generierung von 3D-Szenen aus einfachen Textbeschreibungen nun möglich. Dieser Durchbruch wird die Forschung zur textbasierten 3D-Szenerie-Generierung vorantreiben.

Bisherige Methoden generierten Szenen oft durch Erweiterung von Bildern. Dies führte häufig zu Inkonsistenzen und Unvollständigkeiten. HoloDreamer hingegen generiert zunächst ein hochauflösendes Panoramabild als Grundlage der 3D-Szene und rekonstruiert diese dann mithilfe der 3D-Gauß-Sprühen-Technik schnell, um eine konsistente und vollständige 3D-Szene zu erzeugen.

Konkret generiert das Modul „stilisierte isometrische Panorama-Generierung“ unter Verwendung verschiedener Diffusionsmodelle detailreiche und stilisierte Panoramen basierend auf komplexen Textanweisungen. Eine zyklische Mischtechnik verhindert dabei Risse bei der Panorama-Rotation. Das Modul „verbesserte zweistufige Panorama-Rekonstruktion“ schätzt anschließend die Tiefe, projiziert die RGBD-Daten und extrahiert Punktwolkeninformationen.

image.png

Durch den Einsatz zweier Kameratypen in verschiedenen Szenarien konnte das Forschungsteam die Bilddatensätze in verschiedenen Phasen der 3D-Gauß-Sprühen-Optimierung überwachen und so die endgültige Szenenrekonstruktion optimieren.

Umfassende Tests zeigen, dass HoloDreamer bestehende Forschungsarbeiten in Bezug auf visuelle Konsistenz, Harmonie, Rekonstruktionsqualität und Rendering-Robustheit übertrifft. Dieses innovative Framework verspricht, in zukünftigen Anwendungen eine wichtige Rolle zu spielen und reichhaltigere 3D-Szenerie-Erlebnisse zu ermöglichen.

Wichtigste Punkte:

🌟 HoloDreamer ist ein neuartiges Framework zur 3D-Szenerie-Generierung, das vollständige 3D-Szenen aus Textbeschreibungen erstellt.

🖼️ Das Framework umfasst zwei Module: stilisierte Panorama-Generierung und verbesserte Panorama-Rekonstruktion, um eine hohe Qualität und Konsistenz der Ergebnisse zu gewährleisten.

🚀 HoloDreamer erzielte in Tests hervorragende Ergebnisse und übertraf bisherige 3D-Generierungsmethoden. Es bietet neue Lösungen für die Bereiche virtuelle Realität und Spiele.