Sana
Cadre de synthèse d'images haute résolution hautement efficace
Produit OrdinaireImageSynthèse d'imagesTexte vers image
Sana est un cadre texte-vers-image capable de générer efficacement des images haute résolution jusqu'à 4096×4096 pixels. Il synthétise des images haute résolution et de haute qualité à une vitesse extrêmement rapide tout en maintenant un puissant alignement texte-image. Il peut être déployé sur un GPU d'ordinateur portable. La conception principale de Sana comprend un auto-encodeur à compression profonde, un transformateur de diffusion linéaire (DiT), un petit modèle linguistique uniquement décodeur en tant qu'encodeur de texte, et des stratégies d'entraînement et d'échantillonnage efficaces. Sana-0.6B est 20 fois plus petit et plus de 100 fois plus rapide en termes de débit que les modèles de diffusion modernes de grande taille. De plus, Sana-0.6B peut être déployé sur un GPU d'ordinateur portable 16 Go et générer des images de résolution 1024×1024 en moins d'une seconde. Sana rend la création de contenu à faible coût possible.
Sana Dernière situation du trafic
Nombre total de visites mensuelles
95252
Taux de rebond
51.14%
Nombre moyen de pages par visite
2.4
Durée moyenne de la visite
00:01:02