टेनसेंट हन्युआन डिट (HunyuanDiT) ने हाल ही में समुदाय के साथ मिलकर तीन नए नियंत्रण प्लगइन ControlNet जारी किए हैं, जिनमें टाइल (HD बढ़ाना), इनपेंटिंग (छवि मरम्मत और विस्तार) और लाइनआर्ट (लाइन स्केच से छवि) शामिल हैं, जिससे इसके ControlNet मैट्रिक्स का विस्तार हुआ है। इन प्लगइन्स के जोड़ने से, हन्युआन डिट मॉडल विभिन्न अनुप्रयोगों के व्यापक दायरे को कवर कर सकता है, जिसमें कला, रचनात्मकता, वास्तुकला, फोटोग्राफी, मेकअप और ई-कॉमर्स जैसे 80% मामले और परिदृश्य शामिल हैं, जो वैश्विक कंपनियों और व्यक्तिगत डेवलपर्स, रचनाकारों को अधिक सटीक चित्र निर्माण और अधिक स्वतंत्रता के साथ रचनात्मकता प्रदान करता है।

टाइल प्लगइन छवि में जानकारी का विस्तार करने में सक्षम है, सुपर हाई-डेफिनिशन में बढ़ा सकता है, यहां तक कि 4K से 8K स्पष्टता तक पहुँच सकता है, जो उन परिदृश्यों के लिए उपयुक्त है जहाँ चित्र के विवरण की अत्यधिक खोज होती है। इनपेंटिंग प्लगइन रचनाकार की आवश्यकताओं के अनुसार चित्र में धब्बों और धुंधले भागों को भरने में सक्षम है, जिससे पृष्ठभूमि बदलने, मुख्य पात्र को बदलने जैसे प्रभाव प्राप्त होते हैं, और बड़े पैमाने पर छवि को फिर से तैयार करने में मदद करता है। लाइनआर्ट प्लगइन विभिन्न रेखा प्रकारों का उपयोग करके असली, एनीमे और वास्तुकला की छवियाँ बनाने में सक्षम है, जो वास्तु प्रभाव चित्रों के निर्माण और स्केच के रंगाई के लिए उपयुक्त है।

微信截图_20240815135451.png

इसके अलावा, टेनसेंट हन्युआन डिट ने पहले कैनी (किनारा), डेप्थ (गहराई), पोस (मानव मुद्रा) जैसे शर्तों के ControlNet मॉडल जारी किए हैं, जो डेवलपर्स को इनफेरेंस करने का समर्थन करते हैं, और ControlNet के प्रशिक्षण योजना को ओपन-सोर्स किया है, जिससे डेवलपर्स और रचनाकारों को कस्टम ControlNet मॉडल को प्रशिक्षित करने में सक्षम बनाता है।

मई में पूर्ण अपग्रेड और ओपन-सोर्स की घोषणा के बाद से, हन्युआन डिट उद्योग का पहला चीनी मूल का DiT आर्किटेक्चर ओपन-सोर्स मॉडल है, जो डेवलपर पारिस्थितिकी का निर्माण कर रहा है, विशेष रूप से तेज़ी से पुस्तकालय जारी कर रहा है, जो इनफेरेंस दक्षता को बढ़ाता है, छवि निर्माण के समय को कम करता है, और इनफेरेंस कोड को और अधिक ओपन-सोर्स करता है। जुलाई में, हन्युआन डिट 1.2 संस्करण में अपग्रेड हुआ, जिसमें कम मेमोरी संस्करण को ओपन-सोर्स किया गया, जो केवल 6GB मेमोरी पर चल सकता है, व्यक्तिगत कंप्यूटर पर स्थानीय रूप से तैनात डेवलपर्स के लिए अधिक अनुकूल है।

वर्तमान में, हन्युआन डिट के GitHub पर स्टार की संख्या 3.1k से अधिक हो गई है, जो सबसे लोकप्रिय घरेलू DiT ओपन-सोर्स मॉडल बन गया है।

वेबसाइट

https://dit.hunyuan.tencent.com/

कोड

https://github.com/Tencent/HunyuanDiT

मॉडल

https://huggingface.co/Tencent-Hunyuan/HunyuanDiT

पेपर

https://tencent.github.io/HunyuanDiT/asset/Hunyuan_DiT_Tech_Report_05140553.pdf