Kürzlich gab Alibaba die Open-Source-Veröffentlichung seines neuesten Bildgenerierungsmodells Qwen2vl-Flux bekannt. Dieses Modell bietet nicht nur Funktionen wie Bearbeiten, Fusionieren und Mischen, sondern kann auch aus Benutzereingaben (Bilder oder Text) hochähnliche neue Bilder generieren.
Qwen2vl-Flux bietet leistungsstarke Funktionen zur Bildvariation. Benutzer müssen nur ein Bild eingeben, ohne Textprompt. Das Modell generiert dann mehrere ähnliche Bilder basierend auf dem Original. Lädt ein Benutzer beispielsweise ein Personenfoto hoch, kann das Modell mehrere Perspektiven der Person generieren und unterschiedliche Blickwinkel und Emotionen zeigen.
Das Modell unterstützt auch textgesteuerte Bildmischungen. Wenn ein Benutzer ein Bild und einen zugehörigen Textprompt eingibt, kann Qwen2vl-Flux das eingegebene Bild und den Textinhalt geschickt fusionieren und neue Bildeffekte erzeugen.
Neben den oben genannten Funktionen bietet Qwen2vl-Flux auch die Möglichkeit, Bilder mit Bildsteuerung zu mischen. Benutzer können zwei verschiedene Bilder kombinieren, um beispielsweise Charaktere zu verschmelzen oder Szenen zu wechseln. Wird beispielsweise ein Charakter mit einem anderen Hintergrund kombiniert, kann das Modell beide nahtlos fusionieren und einen neuen visuellen Effekt erzeugen.
Die Funktion zur Übertragung von Gitterstilen ermöglicht es Benutzern, Bilder präzise zu steuern. Benutzer können bestimmte Teile eines Bildes bearbeiten und so eine detaillierte Gestaltung erreichen. So kann man beispielsweise in einem Bild, das Hightech und Natur verbindet, Details der Biolumineszenz oder den Effekt von Morgennebel im Wald hinzufügen, um ein noch reichhaltigeres visuelles Erlebnis zu schaffen.
Projektseite: https://huggingface.co/Djrango/Qwen2vl-Flux
Wichtigste Punkte:
🌟 Qwen2vl-Flux ist Open Source und verfügt über leistungsstarke Funktionen zur Bildgenerierung und -bearbeitung.
🖼️ Unterstützt Bildvariationen und textgesteuerte Bildmischungen, um neue visuelle Effekte zu erzielen.
🔍 Bietet Bildgesteuerte Bildmischungen und Gitterstilübertragung für präzise Benutzerkontrolle.