इस सप्ताह, अली क्लाउड टोंग यि वान शियांग टीम ने एक नया छवि संपादन मॉडल ACE लॉन्च किया है, जिसका उद्देश्य उपयोगकर्ताओं को अधिक सुविधाजनक और बुद्धिमान चित्र निर्माण और संपादन सेवाएँ प्रदान करना है। उपयोगकर्ता केवल सरल मौखिक निर्देशों के माध्यम से चित्र उत्पन्न या संशोधित कर सकते हैं, जिससे छवि संपादन की जटिलता काफी सरल हो जाती है। यह उपकरण व्यापक अनुप्रयोग परिदृश्यों का समर्थन करता है, जिसमें स्टाइलाइज्ड पोर्ट्रेट, कहानीबोर्ड निर्माण, आंतरिक डिज़ाइन आदि शामिल हैं।
ACE मॉडल केवल पाठ से चित्र निर्माण (टेक्स्ट-टू-इमेज) का समर्थन नहीं करता है, बल्कि इसमें शक्तिशाली छवि संपादन कार्यक्षमता भी है। उपयोगकर्ता संवाद के माध्यम से नियंत्रित दृश्य संपादन, तत्व संशोधन, क्षेत्र फिर से चित्रित करने, स्तरित संपादन आदि कार्य कर सकते हैं।
उदाहरण के लिए, उपयोगकर्ता केवल "पृष्ठभूमि बदलें" या "एक क्लिक से वॉटरमार्क हटाएँ" जैसे निर्देश दर्ज करके आसानी से फ़ोटोशॉप जैसी सुविधाएँ प्राप्त कर सकते हैं। यह ध्यान देने योग्य है कि ACE की स्थानीय स्टाइलाइजेशन सुविधा पहले से ही टोंग यि ऐप पर लाइव है, जिससे उपयोगकर्ता अनुभव और भी बेहतर हो गया है।
आधिकारिक जानकारी के अनुसार, ACE मॉडल की मुख्य नवाचार इसकी अनूठी Long-context Condition Unit (LCU) मॉड्यूल में है। LCU कई-मोडल कंडीशन इनपुट का समर्थन कर सकता है, विभिन्न सामान्य संपादन कार्यों की आवश्यकताओं को पूरा करता है, और संपादन डेटा निर्माण श्रृंखला और निर्देश सेट उत्पादन श्रृंखला का पूर्ण निर्माण करता है, जिससे छवि संपादन के प्रभाव की सटीकता और उच्च गुणवत्ता सुनिश्चित होती है।
ACE का लॉन्च न केवल छवि संपादन क्षेत्र में AI के उपयोग को अधिक व्यापक बनाता है, बल्कि वैश्विक डेवलपर्स को ओपन-सोर्स समर्थन भी प्रदान करता है, जो अली क्लाउड के स्मार्ट इमेज प्रोसेसिंग तकनीक क्षेत्र में आगे की प्रगति का प्रतीक है। यह नया उपकरण चित्र प्रसंस्करण की दक्षता और सुविधा को काफी बढ़ाएगा, उपयोगकर्ताओं को अधिक रचनात्मक और व्यक्तिगत संपादन अनुभव प्रदान करेगा।
ओपन-सोर्स पता:
https://github.com/ali-vilab/ACE
अनुभव पता:
https://huggingface.co/spaces/scepter-studio/ACE-Chat
मोडल समुदाय:
https://www.modelscope.cn/models/iic/ACE-0.6B-1024px