SD3.5 का अतीत और वर्तमान

जून में, Stability AI ने Stable Diffusion3Medium जारी किया, लेकिन FLUX के जारी होने के बाद SD3 लगभग बेकार हो गया, क्योंकि FLUX ने हर मोर्चे पर इसे पछाड़ दिया। Stability AI की कठोर शर्तों के कारण SD3 की लोकप्रियता तेजी से गिर गई। इस बार, अधिकारियों ने सबक सीखा और 3.5 संस्करण को आगे बढ़ाया, और वादा किया कि SD3.5 निर्माताओं और रचनाकारों को व्यापक रूप से सुलभ, अत्याधुनिक और अधिकांश उपयोग मामलों में मुफ्त उपकरण प्रदान करेगा।

मॉडल की विशेषताएँ

कुछ घंटे पहले, Stability AI ने Stable Diffusion3.5 का "large" संस्करण आधिकारिक रूप से जारी किया।

इस अपडेट की दो प्रमुख विशेषताएँ हैं:

① मॉडल की शैली में विविधता में वृद्धि, उपयोगकर्ता संकेत शब्दों को संशोधित करके अधिक छवि शैलियों को प्राप्त कर सकते हैं।

② छवि उत्पन्न करने वाली AI की गुणवत्ता में कमी, प्रकाश और सामग्री में अधिक प्राकृतिकता, जिससे उत्पन्न छवियाँ अधिक यथार्थवादी बनती हैं।

Stability AI ने कुल दो संस्करण जारी किए: Large संस्करण और Large Turbo संस्करण।

अधिकारियों का दावा है कि एक Medium संस्करण 29 अक्टूबर को जारी किया जाएगा।

वर्तमान में दोनों संस्करणों का परिचय:

  • Stable Diffusion3.5Large: यह मूल मॉडल 8 बिलियन पैरामीटर के साथ है, जिसमें उत्कृष्ट गुणवत्ता और तात्कालिक अनुपालन है, जो Stable Diffusion श्रृंखला में सबसे शक्तिशाली है। यह मॉडल 1MP रिज़ॉल्यूशन के पेशेवर उपयोग के लिए बहुत उपयुक्त है।

  • Stable Diffusion3.5Large Turbo: Stable Diffusion3.5Large का संक्षिप्त संस्करण केवल 4 चरणों में उत्कृष्ट तेज़ चिपकने वाली उच्च गुणवत्ता वाली छवियाँ उत्पन्न करता है, जिससे यह Stable Diffusion3.5Large की तुलना में कहीं अधिक तेज़ है।

नीचे दिए गए चित्र में आधिकारिक मॉडल तुलना है, जिसमें FLUX.1Dev की तुलना में सौंदर्यशास्त्र कम दिखाई दे रहा है, जबकि संकेत शब्दों का पालन वर्तमान में सबसे अच्छा है।

image.png

इसलिए हम SD3.5 के स्तर का परीक्षण करेंगे, यह देखने के लिए कि FLUX की तुलना में क्या यह AI चित्रण क्षेत्र में शीर्ष पर लौट सकता है।

अधिक विस्तृत जानकारी आधिकारिक रिलीज पृष्ठ पर: https://stability.ai/news/introducing-stable-diffusion-3-5

ऑनलाइन अनुभव

Large ऑनलाइन अनुभव: https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-large

Turbo ऑनलाइन अनुभव: https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-large-turbo

मॉडल डाउनलोड

Large डाउनलोड: https://huggingface.co/stabilityai/stable-diffusion-3.5-large

Turbo डाउनलोड: https://huggingface.co/stabilityai/stable-diffusion-3.5-large-turbo

पहली बार डाउनलोड करने के लिए संपर्क जानकारी भरनी होगी।

image.png

मॉडल उपयोग

हमने आधिकारिक द्वारा प्रदान किए गए उदाहरण कार्यप्रवाह और मॉडल डाउनलोड किए, मॉडल को ComfyUI\models\checkpoints में रखा गया।

image.png

कार्यप्रवाह को ComfyUI में खींचें, यदि कोई नोड गायब है तो गायब नोड स्थापित करें। यदि पहले SD3 का उपयोग किया है तो सभी नोड्स स्थापित होने चाहिए।

image.png

हमें तीन Clip मॉडल लोड करने की आवश्यकता है, जिनके पास नहीं हैं वे यहाँ डाउनलोड कर सकते हैं: https://huggingface.co/stabilityai/stable-diffusion-3-medium/tree/main/text_encoders

डाउनलोड करने के बाद इसे ComfyUI\models\clip फ़ोल्डर में रखें।

सबसे अच्छे परिणाम की तलाश में T5xxl को FP16 संस्करण में बदल सकते हैं।

image.png

चित्रण परिणाम

SD3.5 का चित्रण बहुत अधिक वीडियो मेमोरी लेता है, यहां तक कि 409024G वीडियो मेमोरी भी जल्दी से भर जाती है, एक 1024*1024 छवि को सामान्य रूप से उत्पन्न करने में लगभग 40 सेकंड लगते हैं।

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

सारांश

ऊपर दिए गए चित्रों की तुलना से यह कहा जा सकता है कि दोनों के अपने-अपने फायदे और नुकसान हैं।

SD3.5 में लोगों के हाथों में अभी भी कुछ समस्याएँ हैं, शायद विकास टीम को भी इन समस्याओं का पता है, इसलिए हाथों को छिपाने की स्थिति FLUX की तुलना में अधिक स्पष्ट होगी।

फायदा यह है कि SD3.5 का चित्रण कभी-कभी अधिक यथार्थवादी होता है, FLUX की त्वचा का चित्रण सामान्यतः अधिक चिकना होता है, जबकि SD3.5 अधिक बारीक और वास्तविक होता है।

लंबे पाठ और संकेत शब्दों का पालन करने के प्रभाव में, मुझे लगता है कि दोनों लगभग समान हैं।

सौंदर्यशास्त्र के मामले में, कभी-कभी SD3.5 बेहतर हो सकता है।

प्रदर्शन के मामले में, SD3.5 FLUX से पीछे है, चित्रण FLUX की तुलना में अधिक समय लेता है और अधिक वीडियो मेमोरी का उपयोग करता है।

हालांकि, वर्तमान में FLUX का पारिस्थितिकी तंत्र अधिक परिपूर्ण है, इसलिए निकट भविष्य में SD3.5 शायद FLUX को पार नहीं कर पाएगा।

------------------------------------------------------------------------------------------

वेबसाइट के मालिक का AI ट्यूटोरियल, वेबसाइट के मालिक के घर का AI चित्रण ट्यूटोरियल प्लेटफ़ॉर्म है।

विशाल AI मुफ्त ट्यूटोरियल, लगातार अद्यतन सामग्री।

अधिक AI चित्रण ट्यूटोरियल सीखने के लिए, कृपया वेबसाइट के मालिक के AI ट्यूटोरियल नेटवर्क पर जाएँ:

https://aisc.chinaz.com/jiaocheng/