OpenAI ने हाल ही में sCM (सरल, स्थिर और स्केलेबल संगति मॉडल) नामक एक क्रांतिकारी तकनीक की घोषणा की है, जिसने AI छवि मॉडल के प्रशिक्षण के तरीके को पूरी तरह से बदल दिया है। यह तकनीक मौजूदा संगति मॉडल (CMs) के आधार पर महत्वपूर्ण प्रगति करती है, जो तेजी से छवि निर्माण के लिए एक नई दिशा खोलती है।
तकनीकी मुख्य लाभ:
उच्च गुणवत्ता वाली छवि उत्पन्न करने के लिए केवल दो चरणों की गणना की आवश्यकता है
A100GPU पर एक छवि उत्पन्न करने में केवल 0.11 सेकंड लगते हैं
पारंपरिक फैलाव मॉडल की तुलना में 50 गुना तेजी
अधिकतम मॉडल पैरामीटर 1.5 अरब तक पहुंच गया, जो एक नया रिकॉर्ड है
वास्तविक परीक्षण में, sCM का प्रदर्शन आश्चर्यजनक रहा। CIFAR-10 डेटा सेट पर 2.06 का FID स्कोर प्राप्त किया, और ImageNet पर 512x512 पिक्सल की छवि उत्पन्न करते समय 1.88 का उत्कृष्ट परिणाम हासिल किया। ये मापदंड मौजूदा सर्वश्रेष्ठ फैलाव मॉडल से केवल 10% पीछे हैं, लेकिन गति में गुणात्मक छलांग है।
तकनीकी नवाचार की कुंजी पारंपरिक संगति मॉडल की मौलिक समस्याओं को हल करना है। पहले के मॉडल ने अलग-अलग समय के चरणों का उपयोग किया, जिससे अतिरिक्त पैरामीटर की आवश्यकता होती थी और गलती की संभावना बढ़ जाती थी। OpenAI की शोध टीम ने एक सरल सिद्धांत ढांचे को स्थापित करके विभिन्न विधियों को एकीकृत किया, और प्रशिक्षण अस्थिरता के मुख्य कारणों की पहचान और समाधान में सफल रही।
और भी उत्साहजनक बात यह है कि यह तकनीक मजबूत स्केलेबिलिटी की क्षमता दिखाती है। OpenAI ने ImageNet डेटा सेट पर 1.5 अरब पैरामीटर वाले मॉडल को सफलतापूर्वक प्रशिक्षित किया, जो समान प्रकार के मॉडलों में पहली बार है। शोध से पता चला है कि जैसे-जैसे मॉडल का आकार बढ़ता है, छवि गुणवत्ता लगातार बढ़ती है, जिसका अर्थ है कि भविष्य में बड़े पैमाने पर मॉडल प्रशिक्षण संभव हो सकता है।