Lumina-T2X
Ein einheitliches Framework zur Text-zu-beliebiger-Modalität-Generierung
Normales ProduktBildText-zu-BildText-zu-Video
Lumina-T2X ist ein fortschrittliches Framework zur Generierung von beliebigen Modalitäten aus Text. Es kann Textbeschreibungen in lebendige Bilder, dynamische Videos, detaillierte mehransichtige 3D-Bilder und synthetische Sprache umwandeln. Das Framework verwendet einen großen, flussbasierten Diffusions-Transformer (Flag-DiT) mit bis zu 700 Millionen Parametern und unterstützt Sequenzlängen von bis zu 128.000 Token. Lumina-T2X integriert Bilder, Videos, mehransichtige 3D-Objekte und Sprachspektrogramme in einen räumlich-zeitlichen latenten Token-Raum und kann Ausgaben beliebiger Auflösung, Seitenverhältnisse und Länge generieren.
Lumina-T2X Neueste Verkehrssituation
Monatliche Gesamtbesuche
474564576
Absprungrate
36.20%
Durchschnittliche Seiten pro Besuch
6.1
Durchschnittliche Besuchsdauer
00:06:34