Sana_1600M_512px_MultiLing

Hoch auflösendes, mehrsprachiges Text-zu-Bild-Generierungsmodell

Normales ProduktBildText-zu-BildHoch auflösend
Sana ist ein von NVIDIA entwickeltes Text-zu-Bild-Framework, das hocheffizient Bilder mit einer Auflösung von bis zu 4096×4096 Pixeln generiert. Sana synthetisiert hochauflösende, qualitativ hochwertige Bilder mit extrem hoher Geschwindigkeit und verfügt über eine starke Text-Bild-Ausrichtung. Es kann auf einem Laptop-GPU eingesetzt werden. Das Modell basiert auf einem linearen Diffusions-Transformer und verwendet einen festen, vorab trainierten Text-Encoder und einen räumlich komprimierten latenten Merkmals-Encoder. Es unterstützt die Eingabe von englischen, chinesischen und Emoji-basierten Prompts.
Website öffnen

Sana_1600M_512px_MultiLing Neueste Verkehrssituation

Monatliche Gesamtbesuche

29742941

Absprungrate

44.20%

Durchschnittliche Seiten pro Besuch

5.9

Durchschnittliche Besuchsdauer

00:04:44

Sana_1600M_512px_MultiLing Besuchstrend

Sana_1600M_512px_MultiLing Geografische Verteilung der Besuche

Sana_1600M_512px_MultiLing Traffic-Quellen

Sana_1600M_512px_MultiLing Alternativen