Historia de SD3.5

En junio, Stability AI lanzó Stable Diffusion 3 Medium, pero después del lanzamiento de FLUX, SD3 se convirtió básicamente en un producto obsoleto. Debido a que FLUX lo superaba en varios aspectos, y a las cláusulas abusivas de Stability AI, la reputación de SD3 cayó en picada. En esta ocasión, la empresa aprendió de sus errores y desarrolló la versión 3.5, comprometiéndose a ofrecer a los creadores y desarrolladores herramientas de vanguardia, ampliamente accesibles y gratuitas para la mayoría de los casos de uso.

Características del modelo

Hace apenas unas horas, Stability AI lanzó oficialmente la versión "large" de Stable Diffusion 3.5.

Esta actualización presenta dos características notables:

① Mayor diversidad de estilos de modelo. Los usuarios pueden obtener más estilos de imagen modificando las indicaciones.

② Disminución de la apariencia artificial en la generación de imágenes. Las imágenes generadas presentan una apariencia más natural en cuanto a iluminación y texturas, lo que las hace más realistas.

En esta ocasión, Stability AI lanzó dos versiones: la versión Large y la versión Large Turbo.

La empresa afirma que una versión Medium se lanzará el 29 de octubre.

Descripción de las dos versiones actuales:

  • Stable Diffusion 3.5 Large: Este modelo base tiene 8 mil millones de parámetros, ofrece una calidad excepcional y una adhesión puntual, siendo el más potente de la serie Stable Diffusion. Este modelo es ideal para casos de uso profesionales con resolución de 1 MP.

  • Stable Diffusion 3.5 Large Turbo: Una versión optimizada de Stable Diffusion 3.5 Large que genera imágenes de alta calidad con una adhesión rápida y excelente en solo 4 pasos, lo que lo hace mucho más rápido que Stable Diffusion 3.5 Large.

La siguiente imagen muestra una comparación oficial de los modelos. Se puede observar que la estética es inferior a FLUX 1 Dev, pero el seguimiento de indicaciones es el mejor hasta el momento.

image.png

Por lo tanto, probaremos el nivel de SD 3.5 y lo compararemos con FLUX para ver si puede remontar y recuperar su posición de liderazgo en el campo del dibujo con IA.

Para una descripción más detallada, visite la página oficial de lanzamiento: https://stability.ai/news/introducing-stable-diffusion-3-5

Prueba en línea

Prueba en línea de Large: https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-large

Prueba en línea de Turbo: https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-large-turbo

Descarga del modelo

Descarga de Large: https://huggingface.co/stabilityai/stable-diffusion-3.5-large

Descarga de Turbo: https://huggingface.co/stabilityai/stable-diffusion-3.5-large-turbo

Para la primera descarga, es necesario completar un formulario de contacto.

image.png

Uso del modelo

Descargamos el flujo de trabajo y el modelo de ejemplo proporcionados oficialmente. El modelo se coloca en la carpeta ComfyUI\models\checkpoints.

image.png

Arrastre el flujo de trabajo a ComfyUI. Si faltan nodos, instálelos. Si ha utilizado SD3 anteriormente, probablemente ya tendrá estos nodos instalados.

image.png

Necesitamos cargar tres modelos Clip. Si no los tiene, puede descargarlos aquí: https://huggingface.co/stabilityai/stable-diffusion-3-medium/tree/main/text_encoders

Una vez descargados, colóquelos en la carpeta ComfyUI\models\clip.

Para obtener los mejores resultados, puede reemplazar T5xxl por la versión FP16.

image.png

Resultados de la generación de imágenes

La generación de imágenes de SD3.5 consume mucha memoria RAM, incluso con una GPU de 4090 de 24 GB, es fácil que se llene. Generar una imagen de 1024x1024 normalmente tarda unos 40 segundos.

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

Conclusión

Según la comparación de las imágenes anteriores, se puede decir que cada modelo tiene sus ventajas y desventajas.

SD3.5 todavía tiene problemas con las manos de los personajes. Es posible que el equipo de desarrollo sea consciente de estos problemas, por lo que las manos se ocultan más a menudo que en FLUX.

La ventaja es que SD3.5 a veces genera imágenes más realistas. FLUX suele representar la piel de forma demasiado aceitosa, mientras que SD3.5 es más detallada y realista.

Creo que el rendimiento con textos largos y el seguimiento de indicaciones son similares en ambos modelos.

A veces, la estética de SD3.5 es mejor.

En cuanto al rendimiento, SD3.5 es inferior a FLUX, tarda más en generar imágenes y consume más memoria RAM.

Sin embargo, actualmente el ecosistema de FLUX está más desarrollado, por lo que en el corto plazo SD3.5 probablemente no superará a FLUX.

------------------------------------------------------------------------------------------

Tutoriales de IA de recursos para webmasters, una plataforma de tutoriales de dibujo con IA de ChinaZ.

Gran cantidad de tutoriales de IA gratuitos, con contenido práctico actualizado continuamente.

Para aprender más sobre tutoriales de dibujo con IA, visite el sitio web de tutoriales de IA de recursos para webmasters:

https://aisc.chinaz.com/jiaocheng/