Alibaba hat kürzlich das neue KI-Porträtgenerierungsprojekt EcomID veröffentlicht und ein natives ComfyUI-Plugin dafür vorgestellt. Dieses Tool stellt einen bemerkenswerten Fortschritt im derzeit boomenden Bereich der KI-Porträtgenerierung dar. Es übernimmt nicht nur die Vorteile von InstantID und PulID, sondern erzielt auch in mehreren Schlüsselbereichen Innovationen.
Auf technischer Ebene verwendet EcomID ein innovatives Architekturdesign. Das Projekt greift auf den ID-Encoder und die Cross-Attention-Komponente von PuLID zurück und reduziert durch Aligned-Loss-Training die Interferenzen von ID-Embedding mit Text-Embedding deutlich.
Das Projektteam hat auf Basis von 2 Millionen ausgewählten Porträts die IdentityNet-Architektur entwickelt. Dabei wird der IP-Adapter eingefroren gehalten, während Gesichts-Keypoints als konditionale Eingaben verwendet werden, um eine präzisere Steuerung der Gesichtsmerkmale zu ermöglichen.
Das größte Highlight von EcomID ist seine herausragende Bildgenerierungsqualität. Das System erzeugt nicht nur realistischere und ästhetisch ansprechendere Porträts, sondern bewahrt auch bei Veränderungen von Alter, Frisur, Brille etc. die Identität stabil.
Ein weiterer wichtiger Vorteil ist die vollständige Beibehaltung der Text-zu-Bild-Funktionalität. Es werden hochwertige Hintergründe generiert, während der Grad der Stilisierung minimiert wird, was die Realitätsnähe der generierten Bilder deutlich erhöht.
In der praktischen Anwendung bietet SDXL-EcomID ComfyUI-Benutzern ein völlig neues Benutzererlebnis. Das Plugin unterstützt grundlegende und Face-Swapping-Workflows und ist einfach und intuitiv zu bedienen. Nach einer einfachen Installation und der Konfiguration der notwendigen Abhängigkeiten wie insightface und onnxruntime kann man sofort loslegen. Das System unterstützt flexible Auflösungseinstellungen und empfiehlt einen CFG-Wert von 6 für optimale Ergebnisse.
Besonders erfreulich ist die Möglichkeit der erweiterten Anpassung. Benutzer können die Gewichtungsfaktoren des ip-adapter-Modells und von ControlNet unabhängig voneinander einstellen, um eine feinere Bildsteuerung zu ermöglichen. Diese Funktion macht das Tool besonders flexibel bei der Bearbeitung komplexer Bildgenerierungsaufgaben.
Dieses Update verleiht dem Bereich der KI-Porträtgenerierung zweifellos neuen Schwung und ist besonders für Branchen wie den E-Commerce von großer Bedeutung, die hohe Anforderungen an die Bildqualität stellen. Durch die Bereitstellung von realistischeren und stabileren Porträtgenerierungen definiert EcomID die Qualitätsstandards der KI-Bildgenerierung neu.
Projekt-Adresse: https://github.com/alimama-creative/SDXL_EcomID_ComfyUI