Sana_1600M_1024px_Multilingue
Modèle de génération d'images à partir de texte, haute résolution et multilingue
Produit OrdinaireImageTexte vers imageHaute résolution
Sana est un framework de texte à image développé par NVIDIA, capable de générer efficacement des images jusqu'à une résolution de 4096×4096. Ce modèle synthétise des images haute résolution et de haute qualité à une vitesse étonnante, tout en maintenant une forte capacité d'alignement texte-image. Il peut être déployé sur le GPU d'un ordinateur portable. Le modèle Sana est basé sur un transformateur de diffusion linéaire, utilisant un encodeur de texte pré-entraîné et un encodeur de caractéristiques latentes compressées spatialement. Il prend en charge les emojis, le chinois, l'anglais et les invites mixtes.
Sana_1600M_1024px_Multilingue Dernière situation du trafic
Nombre total de visites mensuelles
29742941
Taux de rebond
44.20%
Nombre moyen de pages par visite
5.9
Durée moyenne de la visite
00:04:44