SD3.5 का अतीत और वर्तमान
जून में, Stability AI ने Stable Diffusion3Medium जारी किया, लेकिन FLUX के जारी होने के बाद SD3 लगभग बेकार हो गया, क्योंकि FLUX ने हर मोर्चे पर इसे पछाड़ दिया। Stability AI की कठोर शर्तों के कारण SD3 की लोकप्रियता तेजी से गिर गई। इस बार, अधिकारियों ने सबक सीखा और 3.5 संस्करण को आगे बढ़ाया, और वादा किया कि SD3.5 निर्माताओं और रचनाकारों को व्यापक रूप से सुलभ, अत्याधुनिक और अधिकांश उपयोग मामलों में मुफ्त उपकरण प्रदान करेगा।
मॉडल की विशेषताएँ
कुछ घंटे पहले, Stability AI ने Stable Diffusion3.5 का "large" संस्करण आधिकारिक रूप से जारी किया।
इस अपडेट की दो प्रमुख विशेषताएँ हैं:
① मॉडल की शैली में विविधता में वृद्धि, उपयोगकर्ता संकेत शब्दों को संशोधित करके अधिक छवि शैलियों को प्राप्त कर सकते हैं।
② छवि उत्पन्न करने वाली AI की गुणवत्ता में कमी, प्रकाश और सामग्री में अधिक प्राकृतिकता, जिससे उत्पन्न छवियाँ अधिक यथार्थवादी बनती हैं।
Stability AI ने कुल दो संस्करण जारी किए: Large संस्करण और Large Turbo संस्करण।
अधिकारियों का दावा है कि एक Medium संस्करण 29 अक्टूबर को जारी किया जाएगा।
वर्तमान में दोनों संस्करणों का परिचय:
Stable Diffusion3.5Large: यह मूल मॉडल 8 बिलियन पैरामीटर के साथ है, जिसमें उत्कृष्ट गुणवत्ता और तात्कालिक अनुपालन है, जो Stable Diffusion श्रृंखला में सबसे शक्तिशाली है। यह मॉडल 1MP रिज़ॉल्यूशन के पेशेवर उपयोग के लिए बहुत उपयुक्त है।
Stable Diffusion3.5Large Turbo: Stable Diffusion3.5Large का संक्षिप्त संस्करण केवल 4 चरणों में उत्कृष्ट तेज़ चिपकने वाली उच्च गुणवत्ता वाली छवियाँ उत्पन्न करता है, जिससे यह Stable Diffusion3.5Large की तुलना में कहीं अधिक तेज़ है।
नीचे दिए गए चित्र में आधिकारिक मॉडल तुलना है, जिसमें FLUX.1Dev की तुलना में सौंदर्यशास्त्र कम दिखाई दे रहा है, जबकि संकेत शब्दों का पालन वर्तमान में सबसे अच्छा है।
इसलिए हम SD3.5 के स्तर का परीक्षण करेंगे, यह देखने के लिए कि FLUX की तुलना में क्या यह AI चित्रण क्षेत्र में शीर्ष पर लौट सकता है।
अधिक विस्तृत जानकारी आधिकारिक रिलीज पृष्ठ पर: https://stability.ai/news/introducing-stable-diffusion-3-5
ऑनलाइन अनुभव
Large ऑनलाइन अनुभव: https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-large
Turbo ऑनलाइन अनुभव: https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-large-turbo
मॉडल डाउनलोड
Large डाउनलोड: https://huggingface.co/stabilityai/stable-diffusion-3.5-large
Turbo डाउनलोड: https://huggingface.co/stabilityai/stable-diffusion-3.5-large-turbo
पहली बार डाउनलोड करने के लिए संपर्क जानकारी भरनी होगी।
मॉडल उपयोग
हमने आधिकारिक द्वारा प्रदान किए गए उदाहरण कार्यप्रवाह और मॉडल डाउनलोड किए, मॉडल को ComfyUI\models\checkpoints में रखा गया।
कार्यप्रवाह को ComfyUI में खींचें, यदि कोई नोड गायब है तो गायब नोड स्थापित करें। यदि पहले SD3 का उपयोग किया है तो सभी नोड्स स्थापित होने चाहिए।
हमें तीन Clip मॉडल लोड करने की आवश्यकता है, जिनके पास नहीं हैं वे यहाँ डाउनलोड कर सकते हैं: https://huggingface.co/stabilityai/stable-diffusion-3-medium/tree/main/text_encoders
डाउनलोड करने के बाद इसे ComfyUI\models\clip फ़ोल्डर में रखें।
सबसे अच्छे परिणाम की तलाश में T5xxl को FP16 संस्करण में बदल सकते हैं।
चित्रण परिणाम
SD3.5 का चित्रण बहुत अधिक वीडियो मेमोरी लेता है, यहां तक कि 409024G वीडियो मेमोरी भी जल्दी से भर जाती है, एक 1024*1024 छवि को सामान्य रूप से उत्पन्न करने में लगभग 40 सेकंड लगते हैं।
सारांश
ऊपर दिए गए चित्रों की तुलना से यह कहा जा सकता है कि दोनों के अपने-अपने फायदे और नुकसान हैं।
SD3.5 में लोगों के हाथों में अभी भी कुछ समस्याएँ हैं, शायद विकास टीम को भी इन समस्याओं का पता है, इसलिए हाथों को छिपाने की स्थिति FLUX की तुलना में अधिक स्पष्ट होगी।
फायदा यह है कि SD3.5 का चित्रण कभी-कभी अधिक यथार्थवादी होता है, FLUX की त्वचा का चित्रण सामान्यतः अधिक चिकना होता है, जबकि SD3.5 अधिक बारीक और वास्तविक होता है।
लंबे पाठ और संकेत शब्दों का पालन करने के प्रभाव में, मुझे लगता है कि दोनों लगभग समान हैं।
सौंदर्यशास्त्र के मामले में, कभी-कभी SD3.5 बेहतर हो सकता है।
प्रदर्शन के मामले में, SD3.5 FLUX से पीछे है, चित्रण FLUX की तुलना में अधिक समय लेता है और अधिक वीडियो मेमोरी का उपयोग करता है।
हालांकि, वर्तमान में FLUX का पारिस्थितिकी तंत्र अधिक परिपूर्ण है, इसलिए निकट भविष्य में SD3.5 शायद FLUX को पार नहीं कर पाएगा।
------------------------------------------------------------------------------------------
वेबसाइट के मालिक का AI ट्यूटोरियल, वेबसाइट के मालिक के घर का AI चित्रण ट्यूटोरियल प्लेटफ़ॉर्म है।
विशाल AI मुफ्त ट्यूटोरियल, लगातार अद्यतन सामग्री।
अधिक AI चित्रण ट्यूटोरियल सीखने के लिए, कृपया वेबसाइट के मालिक के AI ट्यूटोरियल नेटवर्क पर जाएँ: