हाल ही में, अली मामा की क्रिएटिव टीम ने FLUX.1-Turbo-Alpha लॉन्च किया, जो FLUX.1-dev मॉडल पर आधारित एक 8-स्टेप डिस्टिलेशन Lora मॉडल है।
यह मॉडल मल्टी-हेड डिस्क्रिमिनेटर का उपयोग करता है, जो डिस्टिलेशन की गुणवत्ता को काफी बढ़ाता है और टेक्स्ट से इमेज जनरेशन, रिपेयर कंट्रोल नेटवर्क जैसी कई FLUX संबंधित एप्लिकेशनों का समर्थन करता है। टीम ने उपयोग के समय गाइड स्केल को 3.5 और Lora स्केल को 1 सेट करने की सिफारिश की है, और भविष्य में कम स्टेप्स के संस्करण भी लॉन्च किए जाएंगे।
FLUX.1-Turbo-Alpha को सीधे Diffusers फ्रेमवर्क के साथ उपयोग किया जा सकता है। उपयोगकर्ता को केवल कुछ कोड की पंक्तियों के माध्यम से मॉडल को लोड करना और आवश्यक इमेज उत्पन्न करना है। उदाहरण के लिए, आप एक मजेदार दृश्य बना सकते हैं: एक मुस्कुराते हुए स्लॉथ ने लेदर जैकेट, कैowबॉय हैट, चेकर्ड स्कर्ट और बटन के साथ, एक चिकनी वोक्सवैगन वैन के सामने खड़ा है, जिस पर शहर का दृश्य है। बस कुछ पैरामीटर को सरलता से समायोजित करें, और 1024x1024 के रिज़ॉल्यूशन पर उच्च गुणवत्ता वाली इमेज उत्पन्न करें।
इसके अलावा, यह मॉडल ComfyUI के साथ भी संगत है, जिसे टेक्स्ट से इमेज के त्वरित वर्कफ़्लो के लिए या रिपेयर कंट्रोल नेटवर्क में अधिक प्रभावी जनरेशन प्रभाव प्राप्त करने के लिए उपयोग किया जा सकता है। इस तकनीक के माध्यम से, उत्पन्न इमेज मूल आउटपुट का अच्छी तरह से पालन कर सकती है, जिससे उपयोगकर्ता का क्रिएटिव अनुभव बढ़ता है।
FLUX.1-Turbo-Alpha की प्रशिक्षण प्रक्रिया भी उल्लेखनीय है। इस मॉडल को 10 लाख से अधिक ओपन-सोर्स और आंतरिक संसाधनों की इमेज पर प्रशिक्षित किया गया है, जिसकी एस्थेटिक रेटिंग 6.3 से अधिक है और सभी रिज़ॉल्यूशन 800 से अधिक हैं। टीम ने प्रशिक्षण के दौरान इमेज गुणवत्ता बढ़ाने के लिए प्रतिकूल प्रशिक्षण विधि का उपयोग किया, और प्रत्येक ट्रांसफार्मर लेयर के लिए मल्टी-हेड डिज़ाइन जोड़ा। प्रशिक्षण प्रक्रिया में गाइड स्केल को 3.5 पर सेट किया गया था, टाइम शिफ्ट 3 पर सेट किया गया था, मिश्रित सटीकता bf16 का उपयोग किया गया था, और लर्निंग रेट 2e-5, बैच साइज 64, और इमेज साइज 1024x1024 पर निर्धारित किया गया था।
FLUX.1-Turbo-Alpha का लॉन्च, अली मामा की इमेज जनरेशन क्षेत्र में एक और उपलब्धि का प्रतीक है, जो आर्टिफिशियल इंटेलिजेंस तकनीक के प्रसार और उपयोग को बढ़ावा देता है।
प्रोजेक्ट लिंक: https://huggingface.co/alimama-creative/FLUX.1-Turbo-Alpha
मुख्य बिंदु:
🌟 यह मॉडल FLUX.1-dev पर आधारित है, 8-स्टेप डिस्टिलेशन और मल्टी-हेड डिस्क्रिमिनेटर का उपयोग करता है, इमेज जनरेशन की गुणवत्ता में सुधार करता है।
🖼️ टेक्स्ट से इमेज जनरेशन और रिपेयर कंट्रोल नेटवर्क का समर्थन करता है, उपयोगकर्ता आसानी से कई मजेदार दृश्य बना सकते हैं।
📊 प्रशिक्षण प्रक्रिया में प्रतिकूल प्रशिक्षण का उपयोग किया गया, प्रशिक्षण डेटा 10 लाख से अधिक इमेज हैं, जो मॉडल के उच्च गुणवत्ता वाले आउटपुट को सुनिश्चित करता है।