Sana_1600M_512px_MultiLing
Hoch auflösendes, mehrsprachiges Text-zu-Bild-Generierungsmodell
Normales ProduktBildText-zu-BildHoch auflösend
Sana ist ein von NVIDIA entwickeltes Text-zu-Bild-Framework, das hocheffizient Bilder mit einer Auflösung von bis zu 4096×4096 Pixeln generiert. Sana synthetisiert hochauflösende, qualitativ hochwertige Bilder mit extrem hoher Geschwindigkeit und verfügt über eine starke Text-Bild-Ausrichtung. Es kann auf einem Laptop-GPU eingesetzt werden. Das Modell basiert auf einem linearen Diffusions-Transformer und verwendet einen festen, vorab trainierten Text-Encoder und einen räumlich komprimierten latenten Merkmals-Encoder. Es unterstützt die Eingabe von englischen, chinesischen und Emoji-basierten Prompts.
Sana_1600M_512px_MultiLing Neueste Verkehrssituation
Monatliche Gesamtbesuche
29742941
Absprungrate
44.20%
Durchschnittliche Seiten pro Besuch
5.9
Durchschnittliche Besuchsdauer
00:04:44