Hugging Face ने लीडरबोर्ड मूल्यांकन नियमों को अपडेट किया, एआई मूल्यांकन एक नए चरण में प्रवेश करता है

AIbase

द्वारा प्रकाशितAI समाचार · 5 मिनट पढ़ें · Jun 27, 2024

267

Hugging Face ने अपने Open LLM Leaderboard को अपडेट किया है, जो ओपन-सोर्स आर्टिफिशियल इंटेलिजेंस विकास के परिदृश्य पर महत्वपूर्ण प्रभाव डालेगा। यह सुधार आर्टिफिशियल इंटेलिजेंस के विकास के एक महत्वपूर्ण क्षण में आया है, क्योंकि शोधकर्ता और कंपनियाँ बड़े भाषा मॉडल (LLMs) के प्रदर्शन में सुधार के ठहराव का सामना कर रही हैं।

Open LLM Leaderboard एक बेंचमार्क उपकरण है जिसका उपयोग आर्टिफिशियल इंटेलिजेंस भाषा मॉडल की प्रगति को मापने के लिए किया जाता है, और अब इसे फिर से डिज़ाइन किया गया है, जो अधिक कठोर और विस्तृत मूल्यांकन प्रदान करता है। यह अपडेट उस समय आया है जब आर्टिफिशियल इंटेलिजेंस समुदाय ने देखा है कि नए मॉडल जारी करने के बावजूद, महत्वपूर्ण सुधार की गति धीमी हो गई है।

इस लीडरबोर्ड के अपडेट में अधिक जटिल मूल्यांकन मानदंड शामिल किए गए हैं, और यह विस्तृत विश्लेषण प्रदान करता है, जिससे उपयोगकर्ताओं को यह समझने में मदद मिलती है कि कौन से परीक्षण विशेष अनुप्रयोगों के लिए सबसे अधिक प्रासंगिक हैं। यह कदम आर्टिफिशियल इंटेलिजेंस समुदाय की बढ़ती समझ को दर्शाता है कि केवल प्रदर्शन के आंकड़ों के आधार पर वास्तविक दुनिया में मॉडल की उपयोगिता का मूल्यांकन करना अपर्याप्त है।

अपडेट किए गए लीडरबोर्ड में अधिक जटिल मूल्यांकन मानदंड शामिल किए गए हैं और विस्तृत विश्लेषण प्रदान किया गया है, जो उपयोगकर्ताओं को यह समझने में मदद करता है कि कौन से परीक्षण विशेष अनुप्रयोगों के लिए सबसे अधिक प्रासंगिक हैं। यह एआई समुदाय की बढ़ती जागरूकता को दर्शाता है: केवल प्रदर्शन के आंकड़े वास्तविक दुनिया में मॉडल की उपयोगिता का मूल्यांकन करने के लिए पर्याप्त नहीं हैं। लीडरबोर्ड के प्रमुख परिवर्तन शामिल हैं:

- अधिक चुनौतीपूर्ण डेटा सेट का परिचय, उच्च स्तरीय तर्क और वास्तविक दुनिया के ज्ञान के अनुप्रयोग का परीक्षण करने के लिए।

- बहु-चरण संवाद मूल्यांकन को लागू करना, जो मॉडल की संवाद क्षमता का अधिक व्यापक मूल्यांकन करता है।

- गैर-अंग्रेजी भाषा मूल्यांकन का विस्तार करना, जिससे वैश्विक एआई क्षमताओं का बेहतर प्रतिनिधित्व हो सके।

- निर्देशों का पालन करने और कम उदाहरणों के अध्ययन के परीक्षणों को जोड़ना, जो वास्तविक अनुप्रयोगों के लिए तेजी से महत्वपूर्ण हो रहा है।

ये अपडेट एक अधिक व्यापक और चुनौतीपूर्ण बेंचमार्क सेट बनाने के लिए हैं, जो सर्वोत्तम प्रदर्शन करने वाले मॉडल को बेहतर ढंग से अलग करने और सुधार के क्षेत्रों की पहचान करने में मदद करेगा।

मुख्य बिंदु:
⭐ Hugging Face ने Open LLM Leaderboard को अपडेट किया है, जो अधिक कठोर और विस्तृत मूल्यांकन प्रदान करता है, बड़े भाषा मॉडल के प्रदर्शन में सुधार की रुकावट को संबोधित करता है।
⭐ अपडेट में अधिक चुनौतीपूर्ण डेटा सेट का परिचय, बहु-चरण संवाद मूल्यांकन को लागू करना और गैर-अंग्रेजी भाषा मूल्यांकन का विस्तार करना शामिल है, जिसका उद्देश्य एक अधिक व्यापक और चुनौतीपूर्ण बेंचमार्क बनाना है।
⭐ LMSYS Chatbot Arena का लॉन्च Open LLM Leaderboard के साथ पूरक है, जो वास्तविक समय, गतिशील मूल्यांकन के तरीके पर जोर देता है, और आर्टिफिशियल इंटेलिजेंस मूल्यांकन में नई सोच लाता है।

एप्पल एआई समाचार सारांश सुविधा ने व्यापक विवाद उत्पन्न किया, बार-बार गलत जानकारी फैलाने का कारण

एप्पल कंपनी ने हाल ही में एआई समाचार सारांश नामक एक नई सुविधा पेश की है, लेकिन इस सुविधा ने त्वरित समाचारों का सारांश देते समय बार-बार गंभीर गलतियां की हैं, जिसके परिणामस्वरूप उपयोगकर्ताओं को बहुत सारा गलत जानकारी प्राप्त हो रही है। इस सुविधा के लॉन्च होने के बाद से, कई समाचार संगठनों और उपयोगकर्ताओं ने इस पर कड़ी असंतोष व्यक्त किया है, यह मानते हुए कि एप्पल की तकनीक अभी成熟 नहीं है, और सही जानकारी प्रदान करने में प्रभावी नहीं है। रिपोर्ट्स के अनुसार, वाशिंगटन पोस्ट के तकनीक स्तंभकार ज्योफ्री फॉव्लर ने सोशल मीडिया पर एक पोस्ट में बताया कि एप्पल एआई ने एक समाचार सारांश में सही

मस्क ने वैश्विक 'सबसे शक्तिशाली' एआई प्रशिक्षण क्लस्टर की शुरुआत की, जिसमें 100,000 एच100 का उपयोग किया गया है

मस्क की कंपनी xAI ने टेनेसी के मेम्फिस में वैश्विक स्तर पर सबसे बड़ा एआई प्रशिक्षण क्लस्टर स्थापित करने के लिए निवेश किया है, जिसमें 100,000 लिक्विड-कूल्ड एनवीडिया एच100 जीपीयू का उपयोग किया जाएगा। इसका लक्ष्य 2024 के दिसंबर तक 'यूनिवर्सल एआई' का निर्माण करना है, जिससे 'महत्वपूर्ण लाभ' प्रदर्शित किया जा सके। यह कदम जनता का ध्यान आकर्षित कर रहा है, जिससे xAI के लिए एआई क्षेत्र में प्रतिस्पर्धा और तेज हो गई है। OpenAI, गूगल, माइक्रोसॉफ्ट, मेटा जैसे प्रतिद्वंद्वियों द्वारा शक्तिशाली भाषा मॉडलों के विकास के दबाव का सामना करते हुए, xAI को प्रतिस्पर्धा में बने रहने के लिए उद्योग-संबंधित नई तकनीकें विकसित करनी होंगी।

गूगल बनी “अमेरिकी आधिकारिक एआई प्रायोजक” जेमिनी एआई पेरिस ओलंपिक प्रसारण में फैल जाएगा

2024 के पेरिस ओलंपिक खेलों के दौरान, गूगल एक आधिकारिक एआई प्रायोजक के रूप में NBCUniversal के माध्यम से समृद्ध आर्टिफिशियल इंटेलिजेंस सुविधाओं का प्रदर्शन करेगा। लाइव प्रसारण में, गूगल मैप्स का 3D दृश्य वर्साय पैलेस, रोलैंड-गैरोस स्टेडियम और वाटर सेंटर जैसे प्रतियोगिता स्थलों का पूरा दृश्य प्रस्तुत करेगा, साथ ही स्थल की गतिविधियों का विवरण भी प्रदान करेगा। बयानकार गूगल एआई सर्च की सारांश सुविधाओं का उपयोग करके ओलंपिक और पैरालिंपिक मुद्दों पर चर्चा करेंगे। जेमिनी और गूगल के अन्य एआई उपकरण भी कलाकारों और एथलीटों को “सोशल वीडियो और लेट-नाइट प्रमोशन” गतिविधियों में नए ट्रेंड को समझने में मदद करेंगे।

Meta फेसबुक पर एआई टिप्पणी सारांश सुविधा का परीक्षण कर रहा है

Meta फेसबुक पर एआई टिप्पणी सारांश सुविधा का परीक्षण कर रहा है, जिसका उद्देश्य पोस्ट टिप्पणियों की समग्र राय को तेजी से प्रदान करना है, टिप्पणी क्षेत्र के शीर्ष पर सारांश सामग्री को प्रदर्शित करके। इस कदम ने ध्यान आकर्षित किया है और यह सामाजिक मीडिया उपयोगकर्ता अनुभव को बेहतर बनाने की रणनीतियों में से एक बन गया है। हालाँकि, कुछ उपयोगकर्ता संदेह करते हैं कि यह सुविधा सामाजिक मीडिया के मूल कार्य और सामाजिक इंटरैक्शन को प्रभावित कर सकती है। एआई सारांश का उपयोग सामान्य दृष्टिकोण और विषयों को संक्षिप्त करने के लिए किया जाता है, लेकिन कुछ लोग चिंतित हैं कि इससे टिप्पणियों के क्षेत्र में गहराई और विविधता की कमी हो सकती है। विशेषज्ञ मानते हैं कि यह व्यवहार उपयोगकर्ताओं को सीधे इंटरैक्शन के बजाय एआई द्वारा उत्पन्न सामग्री पर निर्भर करने के लिए प्रेरित कर सकता है।

AI समाचार

Hugging Face ने लीडरबोर्ड मूल्यांकन नियमों को अपडेट किया, एआई मूल्यांकन एक नए चरण में प्रवेश करता है

AIbase

संबंधित AI समाचार अनुशंसाएँ

एप्पल एआई समाचार सारांश सुविधा ने व्यापक विवाद उत्पन्न किया, बार-बार गलत जानकारी फैलाने का कारण

मस्क ने वैश्विक 'सबसे शक्तिशाली' एआई प्रशिक्षण क्लस्टर की शुरुआत की, जिसमें 100,000 एच100 का उपयोग किया गया है

गूगल बनी “अमेरिकी आधिकारिक एआई प्रायोजक” जेमिनी एआई पेरिस ओलंपिक प्रसारण में फैल जाएगा

Meta फेसबुक पर एआई टिप्पणी सारांश सुविधा का परीक्षण कर रहा है