Récemment, Alibaba a annoncé l'open source de son dernier modèle de génération d'images, Qwen2vl-Flux. Ce modèle ne se contente pas d'offrir des fonctionnalités d'édition, de fusion et de mixage, mais il est aussi capable de générer des images entièrement nouvelles, très similaires à une image ou à un texte fournis par l'utilisateur.
Qwen2vl-Flux offre de puissantes fonctionnalités de transformation d'images. Il suffit à l'utilisateur de fournir une image, sans aucune invite textuelle, pour que le modèle génère plusieurs images similaires à l'image originale. Par exemple, si un utilisateur télécharge une photo de personne, le modèle peut générer plusieurs représentations de cette personne sous différents angles, montrant différents points de vue et émotions.
Le modèle prend également en charge le mixage d'images guidé par du texte. Lorsqu'un utilisateur fournit une image et une invite textuelle associée, Qwen2vl-Flux peut fusionner intelligemment l'image et le contenu textuel pour créer de nouveaux effets visuels.
En plus des fonctionnalités mentionnées ci-dessus, Qwen2vl-Flux possède la capacité de mélanger des images guidées par des images. Les utilisateurs peuvent combiner deux images différentes pour réaliser une fusion de personnages ou une transformation de scène. Par exemple, en combinant un personnage avec un autre arrière-plan, le modèle peut fusionner les deux de manière transparente pour créer un nouvel effet visuel.
La fonctionnalité de transfert de style de grille du modèle permet aux utilisateurs un contrôle précis de l'image. Les utilisateurs peuvent modifier des parties spécifiques de l'image pour une création plus raffinée. Par exemple, dans une image montrant la combinaison de haute technologie et d'environnement naturel, les utilisateurs peuvent ajouter des détails de bioluminescence ou l'effet de brume matinale dans la forêt, pour une expérience visuelle plus riche.
Accès au projet : https://huggingface.co/Djrango/Qwen2vl-Flux
Points clés :
🌟 Qwen2vl-Flux est open source et possède de puissantes capacités de génération et d'édition d'images.
🖼️ Il prend en charge la transformation d'images et le mixage d'images guidé par du texte, créant de nouveaux effets visuels.
🔍 Il offre un mixage d'images guidé par des images et un transfert de style de grille, permettant aux utilisateurs un contrôle précis.