Generative Powers of Ten
Erzeugt Videos mit kontinuierlicher, mehrskaliger Vergrößerung basierend auf Textbeschreibungen.
Normales ProduktDesignGenerative ModelleMehrskalig
Generative Powers of Ten ist eine Methode zur Erzeugung mehrskalig konsistenter Inhalte aus Text-zu-Bild-Modellen. Sie ermöglicht eine extreme semantische Skalierung von Szenen, z. B. von einer Weitwinkelansicht eines Waldes bis hin zu einer Makroaufnahme eines Insekts auf einem Ast. Diese Darstellung ermöglicht das Rendern von Videos mit kontinuierlicher Vergrößerung oder die interaktive Erkundung verschiedener Skalen eines Szenarios. Dies wird durch eine gemeinsame mehrskalige Diffusionsabtastmethode erreicht, die die Konsistenz zwischen verschiedenen Skalen fördert und gleichzeitig die Integrität jedes einzelnen Abtastprozesses bewahrt. Da jede erzeugte Skala durch unterschiedliche Textaufforderungen gesteuert wird, ermöglicht unsere Methode eine tiefere Skalierung als herkömmliche Super-Resolution-Methoden, denen es möglicherweise schwerfällt, auf völlig unterschiedlichen Skalen neue kontextuelle Strukturen zu erzeugen. Wir haben unsere Methode qualitativ mit Super-Resolution-Methoden und alternativen Techniken des externen Renderings verglichen und gezeigt, dass unsere Methode bei der Erzeugung konsistenter mehrskaliger Inhalte am effektivsten ist.
Generative Powers of Ten Neueste Verkehrssituation
Monatliche Gesamtbesuche
408
Absprungrate
43.27%
Durchschnittliche Seiten pro Besuch
1.0
Durchschnittliche Besuchsdauer
00:00:00