Recientemente, Alibaba anunció la publicación de código abierto de su nuevo modelo de generación de imágenes Qwen2vl-Flux. Este modelo no solo cuenta con diversas funciones como edición, fusión y mezcla, sino que también puede generar imágenes completamente nuevas con una alta similitud a partir de imágenes o texto proporcionados por el usuario.
Qwen2vl-Flux ofrece potentes funciones de transformación de imágenes. Con solo ingresar una imagen, sin necesidad de indicaciones de texto, el modelo puede generar varias imágenes similares a la original. Por ejemplo, si se sube una foto de una persona, el modelo puede generar varias representaciones de la persona desde diferentes ángulos, mostrando diferentes perspectivas y emociones.
El modelo también admite la mezcla de imágenes guiada por texto. Cuando el usuario introduce una imagen y una indicación de texto relacionada, Qwen2vl-Flux puede fusionar ingeniosamente la imagen de entrada con el contenido de texto, creando nuevos efectos visuales.
Además de las funciones mencionadas, Qwen2vl-Flux también tiene la capacidad de mezclar imágenes guiadas por imágenes. El usuario puede combinar dos imágenes diferentes para lograr la fusión de personajes o la transformación de escenas. Por ejemplo, al combinar un personaje con un fondo diferente, el modelo puede fusionar ambos sin problemas, creando un nuevo efecto visual.
La función de transferencia de estilo de cuadrícula del modelo permite a los usuarios controlar las imágenes con precisión. Los usuarios pueden modificar partes específicas de la imagen para lograr una creación más detallada. Por ejemplo, en una imagen que muestra la combinación de alta tecnología y entorno natural, el usuario puede agregar detalles de bioluminescencia o el efecto de la niebla matutina en el bosque, mostrando una experiencia visual más rica.
Enlace al proyecto: https://huggingface.co/Djrango/Qwen2vl-Flux
Puntos clave:
🌟 Qwen2vl-Flux es de código abierto y tiene una potente capacidad de generación y edición de imágenes.
🖼️ Admite la transformación de imágenes y la mezcla de imágenes guiada por texto, creando nuevos efectos visuales.
🔍 Ofrece la mezcla de imágenes guiada por imágenes y la transferencia de estilo de cuadrícula, permitiendo a los usuarios un control preciso.