Stability AI ने तकनीकी बाधाओं को फिर से पार करते हुए नया Stable Diffusion3.5Medium मॉडल पेश किया है। यह जन-सामान्य के लिए बनाया गया AI चित्रण उपकरण न केवल पूरी तरह से मुफ्त है, बल्कि इसका व्यावसायिक उपयोग भी संभव है, और सबसे महत्वपूर्ण बात यह है कि इसने उच्च प्रदर्शन और व्यापकता के बीच एक आदर्श संतुलन स्थापित किया है।
यह मॉडल मल्टी-मोडल डिफ्यूजन ट्रांसफार्मर (MMDiT-X) आर्किटेक्चर का उपयोग करता है, जिसमें 2.5 बिलियन पैरामीटर का संक्षिप्त डिज़ाइन है, जो सामान्य उपयोगकर्ताओं के लिए हार्डवेयर बाधाओं की समस्या को कुशलता से हल करता है। केवल 9.9GB वीडियो मेमोरी की आवश्यकता होती है, जिससे यह अधिकांश उपभोक्ता ग्राफिक्स कार्ड पर सुचारू रूप से चल सकता है, वास्तव में "सभी के लिए उपयोगी" के दृष्टिकोण को साकार करता है।
तकनीकी नवाचार के मामले में, इस मॉडल में तीन पूर्व-प्रशिक्षित पाठ एन्कोडर को एकीकृत किया गया है, और प्रशिक्षण स्थिरता को बढ़ाने के लिए QK मानकीकरण तकनीक को पेश किया गया है। विशेष रूप से उल्लेखनीय है कि इसके पहले 12 परिवर्तन स्तरों में डुअल अटेंशन मॉड्यूल डिज़ाइन ने मॉडल के चित्र गुणवत्ता, लेआउट प्रभाव और जटिल संकेतों की समझ में महत्वपूर्ण सुधार किया है।
मॉडल के प्रशिक्षण प्रक्रिया में संश्लेषित डेटा और चयनित सार्वजनिक डेटा को मिलाकर, प्रगतिशील रिज़ॉल्यूशन बढ़ाने की मिश्रित प्रशिक्षण रणनीति का उपयोग किया गया है, जिससे उत्पन्न चित्रों की विविधता और गुणवत्ता सुनिश्चित होती है। समान श्रेणी के मध्यम मॉडल की तुलना में, यह चित्र उत्पन्न करने के प्रभाव और प्रक्रिया गति में स्पष्ट लाभ दिखाता है।
हालांकि, उपयोगकर्ताओं को उपयोग के दौरान कुछ विवरणों का ध्यान रखना चाहिए: लंबे संकेत शब्दों के कारण चित्र के किनारों पर दोष उत्पन्न हो सकते हैं; चित्र की संरचना की अखंडता को अनुकूलित करने के लिए परतों के मार्गदर्शक नमूने लेने की विधि का उपयोग करने की सिफारिश की जाती है; साथ ही, प्रशिक्षण डेटा वितरण के भिन्नता के कारण, समान संकेत शब्दों के विभिन्न रचनात्मक प्रभाव उत्पन्न हो सकते हैं।
इस मॉडल का विमोचन न केवल व्यक्तिगत रचनाकारों और स्टार्टअप्स को एक सुविधाजनक AI रचनात्मक उपकरण प्रदान करता है, बल्कि यह Stability AI की AI प्रौद्योगिकी के सामान्यीकरण के प्रति प्रतिबद्धता को भी दर्शाता है। चाहे वह कला निर्माण के लिए हो या शैक्षणिक विकास के लिए, यह व्यापक उपयोगकर्ता समूहों के लिए AI रचनात्मकता की संभावनाएँ लाएगा।
मॉडल डाउनलोड लिंक: https://huggingface.co/stabilityai/stable-diffusion-3.5-medium