माइक्रोसॉफ्ट ने अपनी आधिकारिक वेबसाइट पर बहु-मोडल AI एजेंट बेसिक मॉडल "मैग्मा" को आधिकारिक तौर पर जारी किया है और इसे ओपन सोर्स भी किया है। यह नई तकनीक पारंपरिक बुद्धिमान सहायकों की तुलना में अधिक शक्तिशाली बहु-मोडल क्षमता प्रदर्शित करती है, जो छवियों, वीडियो, पाठ आदि कई प्रकार के डेटा को संसाधित कर सकती है, और डिजिटल और भौतिक दुनिया के बीच की बाधाओं को तोड़ सकती है।
मैग्मा न केवल उपयोगकर्ताओं को ई-कॉमर्स प्लेटफॉर्म पर स्वचालित रूप से ऑर्डर देने, मौसम की जानकारी प्राप्त करने जैसे दैनिक कार्यों में मदद कर सकता है, बल्कि भौतिक रोबोट के साथ मिलकर अधिक जटिल कार्यों को भी पूरा कर सकता है। उदाहरण के लिए, वास्तविक शतरंज खेलते समय, मैग्मा उपयोगकर्ताओं को वास्तविक समय में रणनीतिक सुझाव प्रदान कर सकता है, जिससे गेमिंग अनुभव में काफी वृद्धि होती है। साथ ही, इसमें मनोवैज्ञानिक भविष्यवाणी करने की क्षमता है, जो वीडियो में व्यक्तियों या वस्तुओं के भविष्य के व्यवहार का अनुमान लगा सकती है, जिससे वर्चुअल सहायक या रोबोट आसपास के गतिशील वातावरण को बेहतर ढंग से समझ सकते हैं और तदनुसार प्रतिक्रिया दे सकते हैं।
आधिकारिक परिचय के अनुसार, मैग्मा के अनुप्रयोग बहुत व्यापक हैं। यह न केवल घरेलू रोबोट को उन वस्तुओं को व्यवस्थित करना सिखाने में मदद कर सकता है जिन्हें उन्होंने पहले कभी नहीं देखा है, बल्कि अपरिचित कार्यों के लिए वर्चुअल सहायकों के लिए चरण-दर-चरण उपयोगकर्ता इंटरफ़ेस नेविगेशन निर्देश भी उत्पन्न कर सकता है। इस तरह के कार्यों से उपयोगकर्ताओं को नए वातावरण या नए कार्यों का सामना करने पर अधिक सटीक सहायता और मार्गदर्शन मिल सकता है।
मैग्मा दृश्य भाषा क्रिया (VLA) बेसिक मॉडल का हिस्सा है, जो बड़ी मात्रा में सार्वजनिक रूप से उपलब्ध दृश्य और भाषा डेटा से सीख सकता है। यह क्षमता मैग्मा को भाषा, स्थान और समय बुद्धिमत्ता को प्रभावी ढंग से एकीकृत करने में सक्षम बनाती है, जो उपयोगकर्ताओं को डिजिटल और भौतिक दुनिया में जटिल कार्यों के लिए समाधान प्रदान करती है।
मैग्मा का ओपन सोर्स होना डेवलपर्स और शोधकर्ताओं के लिए एक शक्तिशाली उपकरण प्रदान करता है, जिससे बुद्धिमान सहायकों और घरेलू रोबोट के विकास को बढ़ावा मिलता है। भविष्य में, जैसे-जैसे यह तकनीक लगातार बेहतर होती जाएगी, हम अपने दैनिक जीवन में मैग्मा पर आधारित अधिक नवीन अनुप्रयोग देख सकते हैं।
प्रोजेक्ट पता: https://microsoft.github.io/Magma/