माइक्रोसॉफ्ट ने हाल ही में अपने Windows ऑपरेटिंग मॉडल OmniParser का अपग्रेड वर्जन - OmniParser-v2.0 लॉन्च किया है। यह मॉडल डेस्कटॉप और विंडो तत्वों को पहचानने और उनके साथ इंटरैक्ट करने में सक्षम है, जो कि AI एजेंट तकनीक को कंप्यूटर के पूर्ण स्वचालित उपयोग की दिशा में एक और कदम आगे बढ़ाता है।

 OmniParser-v2.0 की मुख्य क्षमता इसके डेस्कटॉप वातावरण की समझ और इंटरैक्शन क्षमता में है। इसका मतलब है कि इस मॉडल के साथ, AI एजेंट न केवल उपयोगकर्ता के निर्देशों को समझ सकता है, बल्कि Windows ऑपरेटिंग सिस्टम स्तर पर सीधे कार्य भी कर सकता है, जैसे कि विशेष विंडो खोलना, बटन को खोजकर क्लिक करना, टेक्स्ट दर्ज करना आदि। 

यह ध्यान देने योग्य है कि OmniParser-v2.0 अन्य मॉडलों जैसे DeepSeek-R1 से भी जुड़ सकता है। यह स्केलेबिलिटी एक अधिक शक्तिशाली और लचीले AI एजेंट का निर्माण करने की संभावना प्रदान करती है।

 विशेषज्ञों का कहना है कि OmniParser-v2.0 जैसे उपकरणों के आने से, AI एजेंट के डाउनस्ट्रीम टूलचेन में लगातार सुधार हो रहा है। ब्राउज़र संचालन से लेकर ऑपरेटिंग सिस्टम संचालन तक, AI एजेंट की क्षमताओं का दायरा लगातार बढ़ रहा है, जो भविष्य में स्वचालित कार्यालय, व्यक्तिगत सहायक आदि क्षेत्रों में AI की बड़ी भूमिका का संकेत देता है। हम एक AI- संचालित, अधिक बुद्धिमान और कुशल कंप्यूटिंग युग के करीब पहुँच रहे हैं।

पता: https://huggingface.co/microsoft/OmniParser-v2.0