हाल ही में, Sakana AI के वैज्ञानिकों ने कृत्रिम बुद्धिमत्ता के क्षेत्र में एक महत्वपूर्ण प्रगति की है। उन्होंने पहली बार दृश्य भाषा आधार मॉडल (vision-language foundation models, FMs) का उपयोग करके कृत्रिम जीवन (Artificial Life, ALife) अनुकरण की स्वचालित खोज में सफलता प्राप्त की है। इस नई विधि का नाम ASAL (Automated Search for Artificial Life, कृत्रिम जीवन के लिए स्वचालित खोज) है, जो कृत्रिम जीवन के क्षेत्र में अनुसंधान में एक क्रांतिकारी परिवर्तन लाती है और इस क्षेत्र के विकास को तेज करने की उम्मीद है।

पारंपरिक कृत्रिम जीवन अनुसंधान मुख्य रूप से मानव डिज़ाइन और परीक्षण-त्रुटि पर निर्भर करता है, जबकि ASAL का उदय इस स्थिति को बदलता है। इस विधि का मुख्य उद्देश्य आधार मॉडल के माध्यम से अनुकरण द्वारा उत्पन्न वीडियो का मूल्यांकन करना है, ताकि स्वचालित रूप से दिलचस्प ALife अनुकरणों की खोज की जा सके। ASAL मुख्य रूप से तीन तंत्रों के माध्यम से जीवन रूपों का पता लगाता है:

image.png

संवर्धित लक्ष्य खोज: पाठ संकेतों के माध्यम से विशिष्ट घटनाओं को उत्पन्न करने वाले अनुकरणों की खोज करना। उदाहरण के लिए, शोधकर्ता "एक कोशिका" या "दो कोशिकाएं" जैसे लक्ष्य निर्धारित कर सकते हैं, जिससे प्रणाली स्वचालित रूप से शर्तों को पूरा करने वाले अनुकरणों को ढूंढ सके।  ओपन-एंडेड खोज: ऐसी अनुकरणों की खोज करना जो समय के साथ निरंतर नवीनता उत्पन्न करते हैं। यह विधि उन अनुकरणों को खोजने में मदद करती है जो मानव अवलोककों के लिए लगातार दिलचस्प होते हैं। ह्यूरेस्टिक खोज: दिलचस्प और विविध अनुकरणों के एक समूह की खोज करना, ताकि "एलियन वर्ल्ड" का खुलासा हो सके।

ASAL की सामान्यता इसे विभिन्न ALife मैट्रिक्स पर प्रभावी ढंग से लागू करने की अनुमति देती है, जिसमें Boids, कण जीवन (Particle Life), जीवन खेल (Game of Life), Lenia और न्यूरल सेलुलर ऑटोमेटा (Neural Cellular Automata) शामिल हैं। शोधकर्ताओं ने इन मैट्रिक्स में अद्वितीय जीवन रूपों की खोज की, जैसे कि Boids में अजीब समूह पैटर्न, Lenia में नए आत्म-संगठित कोशिकाएं, और कॉनवे के जीवन खेल के समान खुले सेलुलर ऑटोमेटा।

इसके अलावा, ASAL उन घटनाओं के लिए मात्रात्मक विश्लेषण का समर्थन करता है जो पहले केवल गुणात्मक विश्लेषण के लिए उपलब्ध थीं। आधार मॉडल में मानव के समान प्रतिनिधित्व क्षमता होती है, जो ASAL को जटिलता को एक अधिक मानव-संगत तरीके से मापने में सक्षम बनाती है। उदाहरण के लिए, शोधकर्ता Lenia अनुकरण में प्लेटफार्म अवधि को मात्रात्मक बनाने के लिए CLIP वेक्टर के अनुकरण प्रक्रिया में परिवर्तन की गति को माप सकते हैं।

image.png

इस अध्ययन का नवाचार यह है कि इसने पूर्व-प्रशिक्षित आधार मॉडल, विशेष रूप से CLIP (कॉन्ट्रास्टिव लैंग्वेज-इमेज प्री-ट्रेनिंग) मॉडल का उपयोग करके अनुकरण के वीडियो का मूल्यांकन किया। CLIP मॉडल तुलना अध्ययन के माध्यम से चित्र और पाठ के प्रतिनिधित्व को संरेखित करता है, जिससे यह मानव द्वारा जटिलता के विचार को समझने में सक्षम होता है। ASAL की विधि विशिष्ट आधार मॉडल या अनुकरण मैट्रिक्स तक सीमित नहीं है, जिसका अर्थ है कि यह भविष्य के मॉडल और मैट्रिक्स के साथ संगत हो सकती है।

शोधकर्ताओं ने ASAL की प्रभावशीलता का प्रयोगात्मक सत्यापन किया है, उन्होंने विभिन्न आधार मॉडल (जैसे CLIP और DINOv2) और विभिन्न ALife मैट्रिक्स का परीक्षण किया। परिणाम बताते हैं कि CLIP मानव-संगत विविधता उत्पन्न करने में DINOv2 की तुलना में थोड़ी बेहतर है, लेकिन दोनों स्पष्ट रूप से निम्न-स्तरीय पिक्सेल प्रतिनिधित्व से बेहतर हैं। यह मानव विविधता की अवधारणा को मापने के लिए गहरे आधार मॉडल प्रतिनिधित्व के उपयोग के महत्व को उजागर करता है।

यह अध्ययन कृत्रिम जीवन के क्षेत्र में एक नया मार्ग खोलता है, जिससे शोधकर्ता उच्च स्तर के प्रश्नों पर ध्यान केंद्रित कर सकते हैं, जैसे कि हम किस प्रकार की घटनाओं का वर्णन करना चाहते हैं, और फिर स्वचालित प्रक्रिया को इन परिणामों की खोज करने दें। ASAL का उदय न केवल वैज्ञानिकों को नए जीवन रूपों की खोज में मदद कर सकता है, बल्कि जीवन अनुकरण में जटिलता और खुलापन का मात्रात्मक विश्लेषण भी कर सकता है। अंततः, यह तकनीक लोगों को जीवन की प्रकृति को समझने और ब्रह्मांड में जीवन के सभी संभावित रूपों को समझने में मदद कर सकती है।

प्रोजेक्ट कोड: https://github.com/SakanaAI/asal/

पेपर का पता: https://arxiv.org/pdf/2412.17799