गूगल की जनरेटिव एआई के क्षेत्र में नवीनतम कोशिशों ने व्यापक ध्यान आकर्षित किया है। कुछ महीनों के साधारण प्रदर्शन के बाद, गूगल जेमिनी तेजी से ऊंचाई पर पहुंच गया है, नया प्रयोगात्मक भाषा मॉडल - जेमिनी-एक्सपी-1206 लॉन्च किया है। नवीनतम चैटएरेना रैंकिंग के अनुसार, यह मॉडल कई प्रतिस्पर्धियों के बीच खड़ा हुआ है और जनरेटिव एआई का नेता बन गया है।
जेमिनी-एक्सपी-1206 ने LMArena पर सबसे उच्च एरेना स्कोर प्राप्त किया है, जो 1379 अंक तक पहुंच गया है, जो कि चैटजीपीटी-4.0 के 1366 अंकों से थोड़ा अधिक है। यह स्कोर दर्शाता है कि जेमिनी-एक्सपी-1206 ने कई मूल्यांकन में उत्कृष्ट प्रदर्शन किया है और अपनी अद्वितीय समग्र क्षमता को प्रदर्शित किया है। इसके अलावा, पिछले जेमिनी-एक्सपी-1114 की तुलना में, नए मॉडल ने भी बेहतर प्रदर्शन दिखाया है।
तो, LMArena क्या है? LMArena, जिसे चैटबॉट एरेना भी कहा जाता है, एक ओपन-सोर्स प्लेटफार्म है जिसका उपयोग बड़े भाषा मॉडलों का मूल्यांकन करने के लिए किया जाता है। यह प्लेटफार्म LMSYS और कैलिफोर्निया विश्वविद्यालय बर्कले के स्काईलैब द्वारा संयुक्त रूप से विकसित किया गया है, जिसका उद्देश्य वास्तविक समय में परीक्षण और सीधे तुलना के माध्यम से समुदाय को LLM के प्रदर्शन का मूल्यांकन करने में सहायता करना है।
रैंकिंग में, एरेना स्कोर विभिन्न कार्यों में मॉडल के औसत प्रदर्शन का प्रतिनिधित्व करता है, और उच्च स्कोर का अर्थ है अधिक क्षमता। हालांकि जेमिनी-एक्सपी-1206 का स्कोर चैटजीपीटी-4.0 से अधिक है, लेकिन वोटों की संख्या में, चैटजीपीटी-4.0 अभी भी बहुत आगे है, कुल 21,929 वोट प्राप्त किए हैं, जबकि जेमिनी-एक्सपी-1206 ने 5052 वोट प्राप्त किए हैं। अधिक वोटों की संख्या आमतौर पर अधिक विश्वसनीयता का संकेत देती है, क्योंकि यह दर्शाता है कि इस मॉडल का व्यापक परीक्षण किया गया है।
इसके अलावा, 95% विश्वसनीयता अंतराल के आंकड़े बताते हैं कि जेमिनी का CI ±10/-5 है, जबकि चैटजीपीटी का CI ±4/-5 है। यह दर्शाता है कि जेमिनी का औसत स्कोर अधिक है, लेकिन चैटजीपीटी-4.0 प्रदर्शन स्थिरता में बेहतर है।
यह उल्लेखनीय है कि जेमिनी प्रयोगात्मक मॉडल अत्याधुनिक प्रोटोटाइप डिज़ाइन हैं, जो परीक्षण और फीडबैक के लिए बनाए गए हैं। ये मॉडल डेवलपर्स को गूगल की नवीनतम एआई प्रगति का पूर्व अनुभव करने का अवसर प्रदान करते हैं, जबकि निरंतर नवाचार को प्रदर्शित करते हैं। हालाँकि, ये प्रयोगात्मक मॉडल अस्थायी हैं, और इन्हें कभी भी बदला जा सकता है, इसलिए इन्हें उत्पादन वातावरण में उपयोग के लिए उपयुक्त नहीं माना जाता है।
यदि आप जेमिनी-एक्सपी-1206 का निःशुल्क उपयोग करना चाहते हैं, तो बस गूगल एआई स्टूडियो पर जाएं, लॉगिन करें और प्रॉम्प्ट बनाने का विकल्प चुनें, और सेटिंग्स में मॉडल को जेमिनी एक्सपेरिमेंटल1206 में बदलें, फिर चैट करना शुरू करें।
हालांकि जेमिनी-एक्सपी-1206 के परिणाम काफी ध्यान आकर्षित करते हैं, लेकिन इसकी प्रयोगात्मक प्रकृति को ध्यान में रखना आवश्यक है। भविष्य की संभावनाओं को प्रकट होने में समय लगेगा, उद्योग इस मजबूत प्रतिस्पर्धी की स्थिर रिलीज की प्रतीक्षा कर रहा है।
प्रोजेक्ट एंट्री: https://ai.google.dev/gemini-api/docs/models/experimental-models?hl=zh-cn
मुख्य बिंदु:
🌟 जेमिनी-एक्सपी-1206 ने LMArena रैंकिंग में 1379 का उच्च स्कोर प्राप्त किया, जो चैटजीपीटी-4.0 के 1366 अंकों से अधिक है।
🗳️ चैटजीपीटी-4.0 ने 21,929 वोट प्राप्त किए, जो स्पष्ट रूप से जेमिनी-एक्सपी-1206 के 5052 वोटों से अधिक है, जो इसकी विश्वसनीयता को दर्शाता है।
🔍 जेमिनी प्रयोगात्मक मॉडल डेवलपर्स को अद्वितीय एआई अनुभव के अवसर प्रदान करते हैं, लेकिन यह अभी भी परीक्षण चरण में हैं और उत्पादन के उपयोग के लिए उपयुक्त नहीं हैं।