हाल ही में, एक नई शोध विधि ने यह उजागर किया है कि एआई मॉडल की सीखने की प्रक्रिया में संभावित क्षमताएं हैं, जो पहले की अपेक्षाओं से परे हैं। शोधकर्ताओं ने "संविधान स्थान" में एआई मॉडल के सीखने की गतिशीलता का विश्लेषण करके यह पता लगाया कि एआई सिस्टम को चित्रों को बेहतर ढंग से समझने और उत्पन्न करने के लिए कैसे सक्षम किया जा सकता है।
चित्र स्रोत टिप्पणी: चित्र एआई द्वारा उत्पन्न, चित्र अधिकृत सेवा प्रदाता Midjourney द्वारा
"संविधान स्थान" एक अमूर्त समन्वय प्रणाली है, जो प्रशिक्षण डेटा में प्रत्येक स्वतंत्र संविधान की विशेषताओं को दर्शाती है, जैसे कि वस्तुओं का आकार, रंग या आकार। शोधकर्ताओं ने कहा कि इस स्थान में सीखने की गतिशीलता का वर्णन करने से संविधान सीखने की गति को उजागर किया जा सकता है, और यह कि सीखने का क्रम डेटा की विशेषताओं से प्रभावित होता है, जिसे "संविधान संकेत" कहा जाता है। यह संविधान संकेत डेटा उत्पन्न करने की प्रक्रिया के संविधान मानों में परिवर्तन के प्रति संवेदनशीलता को दर्शाता है। उदाहरण के लिए, जब डेटा सेट में लाल और नीले रंग के बीच का अंतर स्पष्ट होता है, तो मॉडल रंग सीखने की गति तेजी से होती है।
शोध प्रक्रिया के दौरान, शोध टीम ने देखा कि मॉडल की सीखने की गतिशीलता अचानक दिशा परिवर्तन करती है, "संविधान स्मृति" से "सामान्यीकरण" की ओर। इस घटना की पुष्टि के लिए, उन्होंने एक मॉडल को प्रशिक्षित किया, जिसमें "बड़ा लाल वृत्त", "बड़ा नीला वृत्त" और "छोटा लाल वृत्त" इनपुट किया गया। प्रशिक्षण में मौजूद नहीं "नीला छोटा वृत्त" संयोजन को मॉडल सरल पाठ संकेत द्वारा उत्पन्न नहीं कर सका। लेकिन, "संभावित हस्तक्षेप" तकनीक (जो रंग और आकार के लिए मॉडल में सक्रियण को नियंत्रित करती है) और "अत्यधिक संकेत" तकनीक (जो RGB मानों के माध्यम से रंग विनिर्देशों को बढ़ाती है) का उपयोग करके, शोधकर्ताओं ने "नीला छोटा वृत्त" सफलतापूर्वक उत्पन्न किया। यह दर्शाता है कि हालांकि मॉडल "नीला" और "छोटा" के संयोजन को समझ सकता है, लेकिन यह सरल पाठ संकेत के माध्यम से इस क्षमता को हासिल नहीं कर पाया।
शोधकर्ताओं ने इस विधि को वास्तविक डेटा सेट, जैसे कि CelebA, जिसमें लिंग और मुस्कान जैसी विभिन्न चेहरे की छवि विशेषताएं शामिल हैं, पर भी विस्तारित किया। परिणामों ने दिखाया कि मॉडल मुस्कुराते हुए महिलाओं की छवियों को उत्पन्न करते समय छिपी हुई क्षमताएं प्रदर्शित करता है, जबकि बुनियादी संकेतों का उपयोग करते समय यह कमजोर दिखाई देता है। इसके अलावा, प्रारंभिक प्रयोगों ने यह भी पाया कि Stable Diffusion1.4 का उपयोग करते समय, अत्यधिक संकेत असामान्य छवियों, जैसे त्रिकोणीय क्रेडिट कार्ड उत्पन्न कर सकता है।
इसलिए, शोध टीम ने छिपी हुई क्षमताओं के बारे में एक सामान्य परिकल्पना प्रस्तुत की: उत्पन्न मॉडल में संभावित क्षमताएं होती हैं, जो प्रशिक्षण प्रक्रिया के दौरान अचानक और लगातार प्रकट होती हैं, भले ही मॉडल सामान्य संकेतों का सामना करते समय इन क्षमताओं को प्रदर्शित न करे।
मुख्य बिंदु:
🌟 एआई मॉडल की सीखने की प्रक्रिया में छिपी हुई संभावित क्षमताएं प्रदर्शित होती हैं, जो सामान्य संकेतों द्वारा उत्पन्न स्तर से परे हैं।
🔍 "संभावित हस्तक्षेप" और "अत्यधिक संकेत" जैसी तकनीकों के माध्यम से, शोधकर्ताओं ने इन छिपी हुई क्षमताओं को सक्रिय किया और अप्रत्याशित छवियां उत्पन्न कीं।
📊 शोध ने "संविधान स्थान" की सीखने की गतिशीलता का विश्लेषण किया, जो दर्शाता है कि विभिन्न संविधान की सीखने की गति डेटा की विशेषताओं से प्रभावित होती है।