Sana_1600M_1024px_Mehrsprachig
Hoch auflösendes, mehrsprachiges Text-zu-Bild-Generierungsmodell
Normales ProduktBildText-zu-BildHoch auflösend
Sana ist ein von NVIDIA entwickeltes Text-zu-Bild-Framework, das hocheffizient Bilder mit einer Auflösung von bis zu 4096×4096 Pixel generieren kann. Das Modell synthetisiert mit erstaunlicher Geschwindigkeit hochauflösende, qualitativ hochwertige Bilder und behält dabei eine starke Text-Bild-Ausrichtung bei. Es ist auf Laptops mit GPU einsetzbar. Sana basiert auf einem linearen Diffusions-Transformer und nutzt vorab trainierte Text-Encoder und räumlich komprimierte latente Feature-Encoder. Es unterstützt Emoji, Chinesisch, Englisch und gemischte Eingabeaufforderungen.
Sana_1600M_1024px_Mehrsprachig Neueste Verkehrssituation
Monatliche Gesamtbesuche
29742941
Absprungrate
44.20%
Durchschnittliche Seiten pro Besuch
5.9
Durchschnittliche Besuchsdauer
00:04:44