AI समाचार

वैश्विक AI नवाचार का कोई भी क्षण न चूकें

AI दैनिक

दैनिक तीन मिनट का AI उद्योग रुझान

AI समयरेखा

AI उद्योग मील के पत्थर

AI मुद्रीकरण गाइड

नवीनतम मामले

AI मुद्रीकरण मामला साझा करना

छवि संग्रह

AI छवि निर्माण मुद्रीकरण मामले

वीडियो संग्रह

AI वीडियो निर्माण मुद्रीकरण मामले

ऑडियो संग्रह

AI ऑडियो निर्माण मुद्रीकरण मामले

सामग्री संग्रह

AI सामग्री लेखन मुद्रीकरण मामले

AI ट्यूटोरियल

नवीनतम ट्यूटोरियल

नवीनतम AI ट्यूटोरियल का मुफ्त साझाकरण

AI उत्पाद रैंकिंग

AI वेबसाइटों की कुल विज़िट रैंकिंग दिखाता है

AI ट्रैफ़िक वृद्धि रैंकिंग

ट्रैफ़िक द्वारा सबसे तेज़ी से बढ़ती AI वेबसाइटों को ट्रैक करें

AI ट्रैफ़िक गिरावट रैंकिंग

महत्वपूर्ण ट्रैफ़िक गिरावट वाली AI वेबसाइटों पर ध्यान दें

AI साप्ताहिक रैंकिंग

AI वेबसाइटों की साप्ताहिक विज़िट रैंकिंग दिखाता है

AI ओपन सोर्स प्रोजेक्ट लाइब्रेरी

अवलोकन

GitHub लोकप्रिय AI ओपन सोर्स प्रोजेक्ट का अवलोकन

उत्पाद लाइब्रेरी टूल नेविगेशन

मैथएरेना मूल्यांकन में Gemini-2.5-pro ने अन्य मॉडलों को पछाड़ते हुए असाधारण गणितीय क्षमता का प्रदर्शन किया

AIbase基地

द्वारा प्रकाशितAI समाचार · 4 मिनट पढ़ें · Apr 3, 2025

3 अप्रैल, 2025 की खबर: MathArena द्वारा हाल ही में जारी किए गए बड़े भाषा मॉडल की गणितीय क्षमता के मूल्यांकन के परिणामों के अनुसार, Google का Gemini-2.5-pro अद्भुत प्रदर्शन करते हुए, बिना किसी बाहरी मदद के कठिन गणितीय प्रतियोगिताओं में सबसे आगे है।

अभूतपूर्व उपलब्धि

MathArena प्लेटफ़ॉर्म पर कठोर मूल्यांकन में Gemini-2.5-pro ने 24.40% की सटीकता हासिल की है, यह उपलब्धि न केवल शीर्ष पर है, बल्कि दूसरे स्थान पर रहे DeepSeek-R1 के 4.76% से पाँच गुना अधिक है। यह अभूतपूर्व उपलब्धि दर्शाती है कि Gemini-2.5-pro ने उन्नत गणितीय तर्क क्षमता में गुणात्मक छलांग लगाई है।

कई प्रतियोगिताओं में उत्कृष्ट प्रदर्शन

विशेष रूप से उल्लेखनीय है कि Gemini-2.5-pro ने "AIME 2025 I" प्रतियोगिता परीक्षण में 93% का आश्चर्यजनक परिणाम प्राप्त किया, जो एक मान्यता प्राप्त कठिन गणितीय प्रतियोगिता है। साथ ही, इसने "USAMO 2025" में 50% का प्रदर्शन किया, जो अत्यधिक कठिन गणितीय समस्याओं को हल करने की इसकी क्षमता को दर्शाता है।

तकनीकी महत्व

MathArena मूल्यांकन की विशिष्टता इसकी कठोरता और निष्पक्षता में है, इसमें केवल मॉडल के जारी होने के बाद के गणितीय प्रतियोगिता के प्रश्नों का उपयोग करके परीक्षण किया जाता है, यह सुनिश्चित करने के लिए कि मॉडल को पूर्व-प्रशिक्षण सामग्री से कोई लाभ न मिले। इतनी कठोर परिस्थितियों में, Gemini-2.5-pro इतनी उच्च सफलता दर बनाए रखने में सक्षम है, जो Google द्वारा बड़े मॉडल की गणितीय तर्क क्षमता में एक बड़ी सफलता को दर्शाता है।

उद्योग पर प्रभाव

Gemini-2.5-pro का उत्कृष्ट प्रदर्शन न केवल उन्नत गणितीय सोच के क्षेत्र में बड़े भाषा मॉडल की विशाल क्षमता को सिद्ध करता है, बल्कि AI-सहायक शिक्षा, अनुसंधान और जटिल समस्याओं के समाधान के लिए नई संभावनाएँ भी खोलता है। यह उपलब्धि AI उद्योग में तर्क क्षमता और पेशेवर क्षेत्रों में अनुप्रयोगों के संबंध में प्रतिस्पर्धा और नवाचार को और आगे बढ़ाएगी।

Claude-3.7-Sonnet (Think) के 3.65% और o1-pro (high) के 2.83% की सटीकता की तुलना में, Gemini-2.5-pro का अग्रणी लाभ और अधिक स्पष्ट है, जो दर्शाता है कि बड़े भाषा मॉडल की गणितीय क्षमता के विकास ने एक नए चरण में प्रवेश किया है।

डेटा स्रोत: https://matharena.ai/

Gemini-2.5-pro बड़ाभाषामॉडल MathArena गणितीयक्षमतामूल्यांकन

यह लेख AIbase दैनिक से है

【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।

—— AIbase दैनिक समूह द्वारा बनाया गया

अमेज़ॅन एलेक्सा फंड ने निवेश का दायरा बढ़ाया, कृत्रिम बुद्धिमत्ता स्टार्टअप्स पर ध्यान केंद्रित

अमेज़ॅन का एलेक्सा फंड अब कृत्रिम बुद्धिमत्ता पर केंद्रित स्टार्टअप्स में अधिक निवेश करेगा, जिससे इस तेज़ी से बढ़ते क्षेत्र में और अधिक नवाचार को बढ़ावा मिलेगा।

Mar 27, 2025

ली काईफू ने 01.AI का पुनर्गठन किया: डीपसीक ओपन-सोर्स मॉडल को अपनाना और ओपनएआई के व्यावसायिक मॉडल को चुनौती देना

ली काईफू के नेतृत्व वाली कंपनी 01.AI ने हाल ही में अपने संगठन को फिर से गठित किया है और डीपसीक नामक एक ओपन-सोर्स एआई मॉडल को अपनाया है। यह कदम ओपनएआई के वर्चस्व वाले व्यावसायिक मॉडल को चुनौती देने के रूप में देखा जा रहा है।

Mar 24, 2025

कर्सर ने क्लाउड मैक्स लॉन्च किया, जिससे AI प्रोग्रामिंग का पूरा नज़ारिया बदल गया है

Mar 19, 2025

अली द्वारा ओपन-सोर्स बहुभाषी बड़ा भाषा मॉडल बेबेल, 25 भाषाओं का समर्थन करता है और दुनिया की 90% आबादी को सशक्त बनाता है

Mar 7, 2025

AI समाचार

AI दैनिक

AI समयरेखा

नवीनतम मामले

छवि संग्रह

वीडियो संग्रह

ऑडियो संग्रह

सामग्री संग्रह

नवीनतम ट्यूटोरियल

AI उत्पाद रैंकिंग

AI ट्रैफ़िक वृद्धि रैंकिंग

AI ट्रैफ़िक गिरावट रैंकिंग

AI साप्ताहिक रैंकिंग

संयुक्त राज्य अमेरिका

चीन

भारत

ब्राजील

छवि निर्माण

निजी सहायक

चरित्र निर्माण

वीडियो निर्माण

AI प्रोजेक्ट रैंकिंग

AI प्रोजेक्ट विकास रैंकिंग

AI डेवलपर रैंकिंग

AI संगठन रैंकिंग

डीपसीक

TTS

LLM

ChatGPT