अलीबाबा ने हाल ही में एक नई AI चित्र निर्माण परियोजना EcomID जारी की है, और इसके ComfyUI मूल कार्यान्वयन प्लगइन को लॉन्च किया है। यह उपकरण वर्तमान में चल रहे AI चित्र निर्माण क्षेत्र में महत्वपूर्ण प्रगति लाता है, न केवल InstantID और PulID के लाभों को पूरी तरह से विरासत में लेता है, बल्कि कई प्रमुख संकेतकों पर नवाचार भी करता है।
तकनीकी स्तर पर, EcomID ने अभिनव आर्किटेक्चर डिज़ाइन अपनाया है। यह परियोजना PuLID के ID-Encoder और क्रॉस-अटेंशन घटक से प्रेरित है, और संरेखण हानि प्रशिक्षण के माध्यम से ID embedding को पाठ embedding के हस्तक्षेप को महत्वपूर्ण रूप से कम करता है।
परियोजना टीम ने 20 लाख चयनित चित्रों के आधार पर IdentityNet आर्किटेक्चर बनाया है, IP-adapter को स्थिर रखते हुए, चेहरे की प्रमुख बिंदुओं को शर्त इनपुट के रूप में उपयोग करके, चेहरे की विशेषताओं का अधिक सटीक नियंत्रण हासिल किया है।
EcomID की सबसे बड़ी विशेषता इसकी उत्कृष्ट चित्र निर्माण प्रभावशीलता है। सिस्टम न केवल अधिक वास्तविक और सुंदर चित्र बना सकता है, बल्कि उम्र, बालों की शैली, चश्मे आदि के बाहरी परिवर्तनों में स्थिर पहचान विशेषताओं को बनाए रख सकता है।
एक और महत्वपूर्ण लाभ यह है कि यह पाठ से चित्र बनाने की कार्यक्षमता को पूरी तरह से बनाए रखता है, न केवल उच्च गुणवत्ता की पृष्ठभूमि उत्पन्न कर सकता है, बल्कि शैलीकरण के स्तर को न्यूनतम पर रखता है, जिससे निर्मित चित्रों की वास्तविकता में बहुत सुधार होता है।
व्यावहारिक उपयोग के स्तर पर, SDXL-EcomID ने ComfyUI उपयोगकर्ताओं के लिए एक नई उपयोग अनुभव लाया है। यह प्लगइन मूल और चेहरे के परिवर्तन के दो कार्यप्रवाह का समर्थन करता है, और संचालन सरल और स्पष्ट है। उपयोगकर्ताओं को केवल सरल स्थापना चरणों को पूरा करना होता है, आवश्यक निर्भरता लाइब्रेरी जैसे insightface और onnxruntime को कॉन्फ़िगर करना होता है, और वे उपयोग करना शुरू कर सकते हैं। सिस्टम लचीले रिज़ॉल्यूशन सेटिंग्स का समर्थन करता है, और सर्वोत्तम परिणाम के लिए CFG मान 6 का उपयोग करने की सिफारिश करता है।
और भी आश्चर्यजनक बात यह है कि SDXL-EcomID ने उच्चतम अनुकूलन सुविधाएं प्रदान की हैं। उपयोगकर्ता स्वतंत्र रूप से ip-adapter मॉडल और ControlNet के वजन पैरामीटर को समायोजित कर सकते हैं, जिससे अधिक बारीकी से चित्र नियंत्रण संभव हो सके। यह विशेषता इस उपकरण को जटिल चित्र निर्माण आवश्यकताओं को संभालने में अत्यधिक अनुकूलता प्रदान करती है।
यह अपडेट निस्संदेह AI चित्र निर्माण क्षेत्र में नई ऊर्जा का संचार करता है, विशेष रूप से ई-कॉमर्स जैसे क्षेत्रों के लिए जहाँ चित्र गुणवत्ता की मांग अधिक होती है। अधिक वास्तविक और स्थिर चित्र निर्माण क्षमताओं के माध्यम से, EcomID AI चित्र निर्माण के गुणवत्ता मानकों को फिर से परिभाषित कर रहा है।
परियोजना का पता: https://github.com/alimama-creative/SDXL_EcomID_ComfyUI