इंटरनेट पर सबसे विस्तृत चित्रात्मक समीक्षा! Stability.AI ने SD3.5 बड़े मॉडल को लॉन्च किया, क्या यह FLUX को पछाड़ने में सफल होगा?

站长素材

द्वारा प्रकाशितAI समाचार · 7 मिनट पढ़ें · Oct 23, 2024

297

SD3.5 का अतीत और वर्तमान

जून में, Stability AI ने Stable Diffusion3Medium जारी किया, लेकिन FLUX के जारी होने के बाद SD3 लगभग बेकार हो गया, क्योंकि FLUX ने हर मोर्चे पर इसे पछाड़ दिया। Stability AI की कठोर शर्तों के कारण SD3 की लोकप्रियता तेजी से गिर गई। इस बार, अधिकारियों ने सबक सीखा और 3.5 संस्करण को आगे बढ़ाया, और वादा किया कि SD3.5 निर्माताओं और रचनाकारों को व्यापक रूप से सुलभ, अत्याधुनिक और अधिकांश उपयोग मामलों में मुफ्त उपकरण प्रदान करेगा।

मॉडल की विशेषताएँ

कुछ घंटे पहले, Stability AI ने Stable Diffusion3.5 का "large" संस्करण आधिकारिक रूप से जारी किया।

इस अपडेट की दो प्रमुख विशेषताएँ हैं:

① मॉडल की शैली में विविधता में वृद्धि, उपयोगकर्ता संकेत शब्दों को संशोधित करके अधिक छवि शैलियों को प्राप्त कर सकते हैं।

② छवि उत्पन्न करने वाली AI की गुणवत्ता में कमी, प्रकाश और सामग्री में अधिक प्राकृतिकता, जिससे उत्पन्न छवियाँ अधिक यथार्थवादी बनती हैं।

Stability AI ने कुल दो संस्करण जारी किए: Large संस्करण और Large Turbo संस्करण।

अधिकारियों का दावा है कि एक Medium संस्करण 29 अक्टूबर को जारी किया जाएगा।

वर्तमान में दोनों संस्करणों का परिचय:

Stable Diffusion3.5Large: यह मूल मॉडल 8 बिलियन पैरामीटर के साथ है, जिसमें उत्कृष्ट गुणवत्ता और तात्कालिक अनुपालन है, जो Stable Diffusion श्रृंखला में सबसे शक्तिशाली है। यह मॉडल 1MP रिज़ॉल्यूशन के पेशेवर उपयोग के लिए बहुत उपयुक्त है।
Stable Diffusion3.5Large Turbo: Stable Diffusion3.5Large का संक्षिप्त संस्करण केवल 4 चरणों में उत्कृष्ट तेज़ चिपकने वाली उच्च गुणवत्ता वाली छवियाँ उत्पन्न करता है, जिससे यह Stable Diffusion3.5Large की तुलना में कहीं अधिक तेज़ है।

नीचे दिए गए चित्र में आधिकारिक मॉडल तुलना है, जिसमें FLUX.1Dev की तुलना में सौंदर्यशास्त्र कम दिखाई दे रहा है, जबकि संकेत शब्दों का पालन वर्तमान में सबसे अच्छा है।

इसलिए हम SD3.5 के स्तर का परीक्षण करेंगे, यह देखने के लिए कि FLUX की तुलना में क्या यह AI चित्रण क्षेत्र में शीर्ष पर लौट सकता है।

अधिक विस्तृत जानकारी आधिकारिक रिलीज पृष्ठ पर: https://stability.ai/news/introducing-stable-diffusion-3-5

ऑनलाइन अनुभव

Large ऑनलाइन अनुभव: https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-large

Turbo ऑनलाइन अनुभव: https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-large-turbo

मॉडल डाउनलोड

Large डाउनलोड: https://huggingface.co/stabilityai/stable-diffusion-3.5-large

Turbo डाउनलोड: https://huggingface.co/stabilityai/stable-diffusion-3.5-large-turbo

पहली बार डाउनलोड करने के लिए संपर्क जानकारी भरनी होगी।

मॉडल उपयोग

हमने आधिकारिक द्वारा प्रदान किए गए उदाहरण कार्यप्रवाह और मॉडल डाउनलोड किए, मॉडल को ComfyUI\models\checkpoints में रखा गया।

कार्यप्रवाह को ComfyUI में खींचें, यदि कोई नोड गायब है तो गायब नोड स्थापित करें। यदि पहले SD3 का उपयोग किया है तो सभी नोड्स स्थापित होने चाहिए।

हमें तीन Clip मॉडल लोड करने की आवश्यकता है, जिनके पास नहीं हैं वे यहाँ डाउनलोड कर सकते हैं: https://huggingface.co/stabilityai/stable-diffusion-3-medium/tree/main/text_encoders

डाउनलोड करने के बाद इसे ComfyUI\models\clip फ़ोल्डर में रखें।

सबसे अच्छे परिणाम की तलाश में T5xxl को FP16 संस्करण में बदल सकते हैं।

चित्रण परिणाम

SD3.5 का चित्रण बहुत अधिक वीडियो मेमोरी लेता है, यहां तक कि 409024G वीडियो मेमोरी भी जल्दी से भर जाती है, एक 1024*1024 छवि को सामान्य रूप से उत्पन्न करने में लगभग 40 सेकंड लगते हैं।

सारांश

ऊपर दिए गए चित्रों की तुलना से यह कहा जा सकता है कि दोनों के अपने-अपने फायदे और नुकसान हैं।

SD3.5 में लोगों के हाथों में अभी भी कुछ समस्याएँ हैं, शायद विकास टीम को भी इन समस्याओं का पता है, इसलिए हाथों को छिपाने की स्थिति FLUX की तुलना में अधिक स्पष्ट होगी।

फायदा यह है कि SD3.5 का चित्रण कभी-कभी अधिक यथार्थवादी होता है, FLUX की त्वचा का चित्रण सामान्यतः अधिक चिकना होता है, जबकि SD3.5 अधिक बारीक और वास्तविक होता है।

लंबे पाठ और संकेत शब्दों का पालन करने के प्रभाव में, मुझे लगता है कि दोनों लगभग समान हैं।

सौंदर्यशास्त्र के मामले में, कभी-कभी SD3.5 बेहतर हो सकता है।

प्रदर्शन के मामले में, SD3.5 FLUX से पीछे है, चित्रण FLUX की तुलना में अधिक समय लेता है और अधिक वीडियो मेमोरी का उपयोग करता है।

हालांकि, वर्तमान में FLUX का पारिस्थितिकी तंत्र अधिक परिपूर्ण है, इसलिए निकट भविष्य में SD3.5 शायद FLUX को पार नहीं कर पाएगा।

------------------------------------------------------------------------------------------

वेबसाइट के मालिक का AI ट्यूटोरियल, वेबसाइट के मालिक के घर का AI चित्रण ट्यूटोरियल प्लेटफ़ॉर्म है।

विशाल AI मुफ्त ट्यूटोरियल, लगातार अद्यतन सामग्री।

अधिक AI चित्रण ट्यूटोरियल सीखने के लिए, कृपया वेबसाइट के मालिक के AI ट्यूटोरियल नेटवर्क पर जाएँ:

https://aisc.chinaz.com/jiaocheng/

SD3.5 StableDiffusion StabilityAI FLUX

यह लेख AIbase दैनिक से है

【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।

—— AIbase दैनिक समूह द्वारा बनाया गया

AMD ग्राफ़िक्स कार्ड प्रदर्शन में उल्लेखनीय वृद्धि! Stable Diffusion मॉडल में हुआ बड़ा सुधार

AMD की AI क्षेत्र में प्रगति पर ध्यान देने योग्य है, खासकर Stable Diffusion मॉडल के लिए हाल ही में जारी किए गए ऑप्टिमाइज़ेशन पर। हाल ही में, Stability AI ने ONNX फ्रेमवर्क पर आधारित ऑप्टिमाइज़्ड Stable Diffusion संस्करण जारी किया है, जिसका अर्थ है कि AI कार्यों को चलाते समय AMD के Radeon ग्राफ़िक्स कार्ड और Ryzen इंटीग्रेटेड ग्राफ़िक्स में प्रदर्शन में उल्लेखनीय वृद्धि हुई है, जो अधिकतम 3.8 गुना तक पहुँच सकती है। यह प्रगति न केवल NVIDIA के साथ पारिस्थितिकी तंत्र में अंतर को कम करती है

Apr 18, 2025

ओमनीकंट्रोल आर्ट जारी: फ़्लक्स मॉडल में जीपीटी-4ओ की घिबली आदि कला शैलियों का निचोड़

ओमनीकंट्रोल आर्ट एक नया मॉडल है जो जीपीटी-4ओ की कला शैलियों, जैसे कि घिबली, को फ़्लक्स मॉडल में संयोजित करता है। यह उपयोगकर्ताओं को विभिन्न कला शैलियों में आर्ट जेनरेट करने की अनुमति देता है।

Apr 10, 2025

Krea उन्नत संस्करण वास्तविक समय उत्पादन FLUX वास्तविक समय छवि उत्पादन का समर्थन करता है, रचनात्मक कोलाज और संयोजन

छवि विलय के क्षेत्र में, Krea ने उत्कृष्टता हासिल की है। कस्टम प्रशिक्षण के बाद, Krea ने उन्नत संस्करण वास्तविक समय उत्पादन पेश किया है। उन्नत Krea FLUX वास्तविक समय छवि उत्पादन का समर्थन करता है, आप कई छवियाँ अपलोड कर सकते हैं, छवि को काट सकते हैं, और फिर 3D में बदल सकते हैं, जैसे कोलाज की तरह रचनात्मक कोलाज और संयोजन बना सकते हैं। यह नई प्रकार की छवि उत्पादन नियंत्रण नई इंटरफेस पेश करती है, जो AI छवि उत्पादन की अनियमितता की समस्याओं को हल करती है। उदाहरण के लिए, आप एक कार और एक विमान को एक वनातील छवि में खींच सकते हैं, 3D में परिवर्तित करने के बाद, आप इन तत्वों को स्वतंत्र रूप से घुमा सकते हैं, उन्हें ढूँढ सकते हैं।

Jan 20, 2025

2.8k

AI दैनिक: बाइट डांस द्वारा नई AI प्रोग्रामिंग सुविधा शुरू;腾讯 के बड़े मॉडल द्वारा AI जालसाजी का पता लगाने वाला उपकरण; FLUX Pro ट्यूनिंग API कस्टम AI मॉडल की सुविधा

आपका स्वागत है 【AI दैनिक】栏目 में! यहां आपका हर दिन आर्टिफिशियल इंटेलिजेंस की दुनिया का अन्वेषण करने के लिए गाइड है, हर दिन हम आपको AI क्षेत्र के गर्म विषय पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी प्रवृत्तियों को समझने और अभिनव AI उत्पादों के अनुप्रयोगों को जानने में आपकी सहायता करते हैं। नए AI उत्पादों को जानने के लिए क्लिक करें: https://top.aibase.com/ 1. बाइट डांस डौबाओ द्वारा नई AI प्रोग्रामिंग सुविधा शुरू की गई है, जो GitHub ओपन-सोर्स रिपॉजिटरी को शामिल करते हुए डेवलपर्स की प्रोग्रामिंग दक्षता और अनुभव को बढ़ाने के उद्देश्य से है। माइक्रोसॉफ्ट

Jan 17, 2025

1.6k

ब्लैक फॉरेस्ट लैब्स ने FLUX Pro माइक्रो-ट्यूनिंग API लॉन्च किया, सिर्फ पांच सैंपल इमेज का उपयोग करके AI मॉडल कस्टमाइज करें

जर्मन आर्टिफिशियल इंटेलिजेंस स्टार्टअप ब्लैक फॉरेस्ट लैब्स ने हाल ही में FLUX Pro माइक्रो-ट्यूनिंग API लॉन्च किया है, जो उपयोगकर्ताओं को इस API के माध्यम से सिर्फ पांच सैंपल इमेज का उपयोग करके FLUX Pro AI इमेज मॉडल को विशेष ब्रांड के दृश्य शैली के अनुसार कस्टमाइज करने की अनुमति देता है। ब्लैक फॉरेस्ट लैब्स के अनुसार, माइक्रो-ट्यूनिंग के बाद, मॉडल लचीलापन बनाए रखता है, जिससे उपयोगकर्ता द्वारा प्रदान की गई सामग्री को नए इमेज क्रिएशन में समाहित किया जा सकता है, यह प्रणाली।

Jan 17, 2025

2.4k

स्टेबिलिटी एआई ने SPAR3D लॉन्च किया: एक छवि से 3डी ऑब्जेक्ट एक सेकंड में तैयार करें

हाल ही में समाप्त हुई CES प्रदर्शनी में, स्टेबिलिटी एआई ने SPAR3D (स्टेबल प्वाइंट अवेयर3D) नामक एक अभिनव पद्धति की घोषणा की, जो एक चरण में छोटी अवधि में एकल छवि से सटीक 3डी ऑब्जेक्ट बनाने में सक्षम होती है। यह तकनीक गेम डेवलपर्स, उत्पाद डिज़ाइनरों और वातावरण निर्माताओं के लिए 3डी प्रोटोटाइप डिज़ाइन के नए तरीके प्रदान करती है। SPAR3D की विशिष्टता यह है कि यह दृश्य भागों और

Jan 9, 2025

3.1k

FLUX ने NVIDIA के साथ सहयोग किया, अपने FLUX मॉडल को GeForce RTX 50 श्रृंखला ग्राफ़िक्स कार्ड के लिए अनुकूलित किया

FLUX ने आज NVIDIA के साथ एक रणनीतिक सहयोग की घोषणा की, जिसमें दोनों पक्ष AI छवि निर्माण क्षेत्र में गहन तकनीकी सहयोग करेंगे। इस सहयोग का प्रमुख आकर्षण प्रदर्शन अनुकूलन, मेमोरी दक्षता में सुधार और नवोन्मेषी 3D निर्माण कार्यप्रवाह हैं। हार्डवेयर अनुकूलन के संदर्भ में, FLUX मॉडल को नए जारी किए गए GeForce RTX 50 श्रृंखला ग्राफ़िक्स कार्ड के लिए पूरी तरह से अनुकूलित किया गया है। इसका विकास संस्करण FLUX.1 NVIDIA Blackwell आर्किटेक्चर के FP4 गणना तकनीक के साथ RTX 5090 पर महत्वपूर्ण सफलताओं को प्राप्त करता है।

Jan 7, 2025

4.3k

अत्यधिक तेज़ ऑडियो उत्पन्न करने वाला मॉडल TangoFlux: केवल 3 सेकंड में 30 सेकंड लंबी ऑडियो उत्पन्न करें

कृत्रिम बुद्धिमत्ता के क्षेत्र में, टेक्स्ट-ऑडियो उत्पन्न करने वाली तकनीक धीरे-धीरे अनुसंधान का热点 बन रही है। हाल ही में, शोधकर्ताओं ने एक नए मॉडल TANGOFLUX का परिचय दिया है, जो प्रदर्शन और दक्षता दोनों में उत्कृष्टता दिखाता है। TANGOFLUX एक कुशल टेक्स्ट से ऑडियो उत्पन्न करने वाला मॉडल है, जिसमें 515 मिलियन पैरामीटर हैं, जो केवल 3.7 सेकंड में अधिकतम 30 सेकंड की 44.1kHz ऑडियो उत्पन्न कर सकता है, यह गति इसे एक ही A40GPU पर बेहद प्रभावशाली बनाती है। TANGOFLUX मुख्य रूप से

Jan 2, 2025

3.8k

बाइटडांस द्वारा 1.58-बिट क्वांटाइज्ड FLUX मॉडल, मेमोरी में 7.7 गुना कमी, प्रदर्शन में सुधार!

कृत्रिम बुद्धिमत्ता (AI) द्वारा संचालित टेक्स्ट-टू-इमेज (T2I) निर्माण मॉडल, जैसे कि DALLE3, Adobe Firefly3, आदि, उत्कृष्ट निर्माण क्षमताएँ प्रदर्शित करते हैं और वास्तविक अनुप्रयोगों में अपार संभावनाएँ रखते हैं। हालाँकि, ये मॉडल आमतौर पर अरबों के पैमाने पर होती हैं, जिससे मेमोरी की मांग बहुत अधिक होती है, जो मोबाइल डिवाइस जैसे संसाधन-सीमित प्लेटफार्मों पर तैनाती के लिए बड़ी चुनौतियाँ पैदा करती हैं। इन समस्याओं को हल करने के लिए, बाइटडांस और POSTECH के शोधकर्ताओं ने T2I मॉडल के लिए अत्यधिक निम्न-बिट क्वांटाइजेशन तकनीक का पता लगाया।

Dec 31, 2024

3.1k

Shakker AI ने नया उन्नत छवि जनरेशन मॉडल Zeno-1 लॉन्च किया, जो नियंत्रण की एक श्रृंखला प्रदान करता है

Shakker AI ने आज अपने नवीनतम उन्नत छवि जनरेशन मॉडल - Zeno-1 की घोषणा की। यह मॉडल न केवल पूर्ववर्ती FLUX.1 की उत्कृष्टestética और कलात्मकता को अपनाता है, बल्कि आंतरिक सिफारिश प्रणाली के माध्यम से शैली विविधता में एक छलांग भी प्रदान करता है। Zeno-1 का लॉन्च डिजिटल कला निर्माण उपकरणों के लिए एक नए युग का प्रतीक है। यह उपयोगकर्ताओं को अपने डिजिटल कला कार्यों को पहले कभी न देखे गए तरीकों से आकार देने और उन्हें परिष्कृत करने की अनुमति देने के लिए नियंत्रण उपकरणों की एक श्रृंखला प्रदान करता है। Zeno-1 मॉडल की मुख्य विशेषताएँ इस प्रकार हैं: पैलेट नियंत्रण: उपयोग करें

Dec 12, 2024

2.2k

AI समाचार

AI दैनिक

AI समयरेखा

अल हार्डवेयर

नवीनतम मामले

छवि संग्रह

वीडियो संग्रह

ऑडियो संग्रह

सामग्री संग्रह

नवीनतम ट्यूटोरियल

AI उत्पाद रैंकिंग

AI ट्रैफ़िक वृद्धि रैंकिंग

AI ट्रैफ़िक गिरावट रैंकिंग

AI साप्ताहिक रैंकिंग

संयुक्त राज्य अमेरिका

चीन

भारत

ब्राजील

छवि निर्माण

निजी सहायक

चरित्र निर्माण

वीडियो निर्माण

AI प्रोजेक्ट रैंकिंग

AI प्रोजेक्ट विकास रैंकिंग

AI डेवलपर रैंकिंग

AI संगठन रैंकिंग

डीपसीक

TTS

LLM

ChatGPT

अवलोकन