हाल ही में, त्सिंगhua विश्वविद्यालय के स्मार्ट उद्योग अनुसंधान संस्थान (AIR) ने 2024年12月24日 को AutoDroid-V2 नामक एक AI मॉडल जारी किया, जिसका उद्देश्य मोबाइल उपकरणों की स्वचालित नियंत्रण क्षमता को अनुकूलित करना है। इस मॉडल ने छोटे भाषा मॉडल के उपयोग के माध्यम से, उपयोगकर्ताओं द्वारा प्राकृतिक भाषा के माध्यम से संचालन की दक्षता को महत्वपूर्ण रूप से बढ़ाया है।
AutoDroid-V2 एक स्क्रिप्ट-आधारित दृष्टिकोण अपनाता है, जो पारंपरिक क्लाउड-आधारित बड़े भाषा मॉडल (LLM) के तरीके से भिन्न है। यह नवाचार उपकरणों को उपयोगकर्ता के निर्देशों को कुशलता से निष्पादित करने में सक्षम बनाता है, जिससे क्लाउड सेवाओं पर निर्भरता कम हो जाती है, और इस प्रकार गोपनीयता और सुरक्षा में महत्वपूर्ण सुधार होता है। साथ ही, इसने उपयोगकर्ता पक्ष के डेटा उपयोग और सर्वर पक्ष के संचालन लागत को भी कम किया है, जिससे मोबाइल उपकरणों का व्यापक उपयोग बढ़ा है।
परियोजना की पृष्ठभूमि में, हाल के वर्षों में, बड़े भाषा मॉडल और दृश्य भाषा मॉडल का उदय प्राकृतिक भाषा आदेशों के माध्यम से मोबाइल उपकरणों को नियंत्रित करना संभव बना दिया है। ये तकनीकें जटिल उपयोगकर्ता कार्यों के समाधान के लिए नए रास्ते प्रदान करती हैं। हालांकि, पारंपरिक "स्टेप-बाय-स्टेप GUI इंटेलिजेंस" विधि में उच्च डेटा उपयोग और गोपनीयता सुरक्षा जोखिमों की समस्याएँ हैं, जिससे बड़े पैमाने पर तैनाती में बाधाएँ उत्पन्न होती हैं।
AutoDroid-V2 की नवीनता इस तथ्य में है कि यह उपयोगकर्ता के निर्देशों के आधार पर बहु-चरण स्क्रिप्ट उत्पन्न कर सकता है, और फिर एक बार में कई GUI संचालन को निष्पादित कर सकता है। यह विधि पूछताछ की आवृत्ति को काफी कम कर देती है, संसाधन उपयोग को कम करती है, और उपयोगकर्ता के उपकरण पर सीधे कार्य स्क्रिप्ट उत्पन्न और निष्पादित करने में सक्षम बनाती है। यह मॉडल ऑफ़लाइन स्थिति में एप्लिकेशन दस्तावेज़ तैयार करेगा, जो बाद की स्क्रिप्ट निर्माण के लिए आधार तैयार करेगा।
प्रदर्शन परीक्षण में, AutoDroid-V2 ने 23 मोबाइल अनुप्रयोगों पर 226 कार्यों का बेंचमार्क परीक्षण किया, और पिछले मॉडलों, जैसे AutoDroid और SeeClick की तुलना में, कार्य पूर्णता दर 10.5% से 51.7% तक बढ़ गई। इसके अलावा, इसके इनपुट और आउटपुट के टोकन उपयोग क्रमशः 43.5 और 5.8 गुना कम हो गए, और मॉडल की अनुमानित देरी मूल से 5.7 से 13.4 गुना कम हो गई। ये परिणाम AutoDroid-V2 की वास्तविक अनुप्रयोगों में दक्षता और विश्वसनीयता को दर्शाते हैं।
मुख्य बिंदु:
🌟 AutoDroid-V2 त्सिंगhua विश्वविद्यालय द्वारा प्रस्तुत एक नया AI मॉडल है, जो मोबाइल उपकरणों की प्राकृतिक भाषा नियंत्रण दक्षता को बढ़ाता है।
🔒 यह मॉडल छोटे भाषा मॉडल के माध्यम से क्लाउड सेवाओं पर निर्भरता को कम करता है, जिससे उपयोगकर्ता की गोपनीयता और सुरक्षा में सुधार होता है।
📈 बेंचमार्क परीक्षण दर्शाते हैं कि AutoDroid-V2 में कार्य पूर्णता दर और संसाधन उपयोग दोनों में महत्वपूर्ण सुधार हुआ है, जो इसकी मजबूत अनुप्रयोग क्षमता को प्रदर्शित करता है।