Sana
Marco de síntesis de imágenes de alta resolución y alta eficiencia
Producto ComúnImagenSíntesis de imágenesTexto a imagen
Sana es un marco de texto a imagen capaz de generar de manera eficiente imágenes de hasta 4096×4096 píxeles de resolución. Sintetiza imágenes de alta resolución y alta calidad a una velocidad extremadamente rápida, manteniendo una potente alineación texto-imagen, y puede desplegarse en una GPU de portátil. El diseño central de Sana incluye un autoencoder de compresión profunda, un transformador de difusión lineal (DiT), un modelo de lenguaje pequeño de solo decodificador como codificador de texto, y estrategias de entrenamiento y muestreo eficientes. Sana-0.6B es 20 veces más pequeño y más de 100 veces más rápido en términos de rendimiento que los modelos de difusión grandes modernos. Además, Sana-0.6B se puede implementar en una GPU de portátil de 16 GB, generando imágenes de 1024×1024 píxeles en menos de un segundo. Sana hace posible la creación de contenido a bajo coste.
Sana Situación del tráfico más reciente
Total de visitas mensuales
95252
Tasa de rebote
51.14%
Páginas promedio por visita
2.4
Duración promedio de la visita
00:01:02