OmniParser V2

OmniParser V2 एक ऐसी तकनीक है जो किसी भी LLM को कंप्यूटर-नियंत्रित एजेंट में बदल देती है।

अंतर्राष्ट्रीय चयनप्रोग्रामिंगकृत्रिम बुद्धिमत्ताGUI स्वचालन
OmniParser V2 माइक्रोसॉफ्ट रिसर्च टीम द्वारा विकसित एक उन्नत आर्टिफिशियल इंटेलिजेंस मॉडल है, जिसका उद्देश्य बड़े भाषा मॉडल (LLM) को ऐसे बुद्धिमान एजेंट में बदलना है जो ग्राफिकल यूजर इंटरफेस (GUI) को समझ सकें और उसका संचालन कर सकें। यह तकनीक इंटरफ़ेस स्क्रीनशॉट को पिक्सेल स्पेस से व्याख्यात्मक संरचित तत्वों में बदलकर LLM को इंटरैक्टिव आइकन को अधिक सटीक रूप से पहचानने और स्क्रीन पर पूर्व निर्धारित क्रियाएँ करने में सक्षम बनाती है। OmniParser V2 ने छोटे आइकन का पता लगाने और तेज़ी से तर्क करने में उल्लेखनीय प्रगति की है, जिसने ScreenSpot Pro बेंचमार्क टेस्ट में GPT-4o के साथ मिलकर 39.6% की औसत सटीकता हासिल की है, जो मूल मॉडल के 0.8% से कहीं अधिक है। इसके अलावा, OmniParser V2 OmniTool उपकरण भी प्रदान करता है, जो कई LLM के साथ उपयोग के लिए समर्थन करता है, जो GUI स्वचालन के विकास को और आगे बढ़ाता है।
वेबसाइट खोलें

OmniParser V2 नवीनतम ट्रैफ़िक स्थिति

मासिक कुल विज़िट

1154579588

बाउंस दर

44.37%

प्रति विज़िट औसत पृष्ठ

3.4

औसत विज़िट अवधि

00:03:21

OmniParser V2 विज़िट प्रवृत्ति

OmniParser V2 विज़िट भौगोलिक वितरण

OmniParser V2 ट्रैफ़िक स्रोत

OmniParser V2 विकल्प