Lumina-T2X

Ein einheitliches Framework zur Text-zu-beliebiger-Modalität-Generierung

Normales ProduktBildText-zu-BildText-zu-Video
Lumina-T2X ist ein fortschrittliches Framework zur Generierung von beliebigen Modalitäten aus Text. Es kann Textbeschreibungen in lebendige Bilder, dynamische Videos, detaillierte mehransichtige 3D-Bilder und synthetische Sprache umwandeln. Das Framework verwendet einen großen, flussbasierten Diffusions-Transformer (Flag-DiT) mit bis zu 700 Millionen Parametern und unterstützt Sequenzlängen von bis zu 128.000 Token. Lumina-T2X integriert Bilder, Videos, mehransichtige 3D-Objekte und Sprachspektrogramme in einen räumlich-zeitlichen latenten Token-Raum und kann Ausgaben beliebiger Auflösung, Seitenverhältnisse und Länge generieren.
Website öffnen

Lumina-T2X Neueste Verkehrssituation

Monatliche Gesamtbesuche

474564576

Absprungrate

36.20%

Durchschnittliche Seiten pro Besuch

6.1

Durchschnittliche Besuchsdauer

00:06:34

Lumina-T2X Besuchstrend

Lumina-T2X Geografische Verteilung der Besuche

Lumina-T2X Traffic-Quellen

Lumina-T2X Alternativen