अलीबाबा की "टोंग यि कियान वेन" टीम ने एक बड़ा समाचार दिया है! उन्होंने अभी हाल ही में Qwen2Math डेमो जारी किया है, यह गणितीय मॉडल वास्तव में एक छोटा राक्षस है, यहां तक कि GPT-4 भी इसके नीचे दब गया है।
यह मॉडल न केवल पाठ्य इनपुट के गणितीय प्रश्नों को संभाल सकता है, बल्कि चित्रों और स्क्रीनशॉट में मौजूद सूत्रों को भी समझ सकता है। कल्पना कीजिए, यदि आप किसी समीकरण की तस्वीर लेते हैं, तो यह आपको उत्तर दे सकता है, वास्तव में यह गणित कक्षा में सवालों को हल करने का जादुई उपकरण है! (बेशक, हम धोखाधड़ी को प्रोत्साहित नहीं करते हैं)
Qwen2-Math ने तीन संस्करण लॉन्च किए हैं: 72B, 7B और 1.5B। इनमें से 72B संस्करण वास्तव में एक गणितीय प्रतिभा है, MATH डेटासेट पर यह GPT-4 से 7 अंक अधिक प्राप्त करता है, जो 9.6% की वृद्धि है। यह ऐसा है जैसे आप उच्चतर माध्यमिक परीक्षा में गणित में 145 अंक लाए, जबकि आपके पास वाला प्रतिभाशाली छात्र केवल 132 अंक लाया।
और भी शानदार यह है कि, 7B संस्करण में 72B के ओपन-सोर्स गणितीय मॉडल NuminaMath से एक-दसवें से भी कम पैरामीटर का उपयोग करके इसे पार कर गया है। जान लें, NuminaMath वह मॉडल है जिसे विश्व के पहले AIMO में पुरस्कार मिला था, और यह पुरस्कार गणित की दुनिया के "शीर्ष दिग्गज" ताओ ज़ेह्शियान द्वारा व्यक्तिगत रूप से दिया गया था।
अलीबाबा के वरिष्ठ एल्गोरिदम विशेषज्ञ लिन जून्गयांग ने उत्साह के साथ घोषणा की कि उन्होंने Qwen2 मॉडल को एक गणितीय विशेषज्ञ में बदल दिया है। उन्होंने यह कैसे किया? उन्होंने एक विशेष "गणितीय दिमागी तरल" का उपयोग किया - एक विशेष रूप से डिज़ाइन की गई गणितीय विशेष पाठ्य सामग्री। इस "दिमागी तरल" में उच्च गुणवत्ता वाले गणितीय इंटरनेट पाठ, पुस्तकें, कोड, परीक्षा प्रश्न, और यहां तक कि Qwen2 मॉडल द्वारा "रचित" गणितीय प्रश्न शामिल हैं।
परिणाम क्या हैं? GSM8K, MATH जैसे क्लासिक गणितीय परीक्षण सेट पर, Qwen2-Math-72B ने 405B के Llama-3.1 को पीछे छोड़ दिया। ये परीक्षण सेट मज़ाक नहीं हैं, इनमें बीजगणित, ज्यामिति, संभाव्यता, संख्या सिद्धांत जैसे विभिन्न गणितीय प्रश्न शामिल हैं।
केवल यही नहीं, Qwen2-Math ने चीनी डेटासेट CMATH और उच्चतर माध्यमिक परीक्षा के प्रश्नों को भी चुनौती दी है। चीनी डेटासेट पर, यहां तक कि 1.5B संस्करण भी 70B के Llama3.1 को हरा सकता है। और, किसी भी संस्करण के लिए, Qwen2 मूल मॉडल की तुलना में, प्रदर्शन में स्पष्ट सुधार है।
लगता है कि "टोंग यि कियान वेन" ने वास्तव में एक गणितीय प्रतिभा का पता लगाया है! क्या हमें भविष्य में गणित के सवालों के लिए इसे पूछना चाहिए? लेकिन याद रखें, यह केवल एक उपकरण है, इसे अपनी बुद्धिमत्ता से आपको भ्रमित न होने दें, अपनी गणितीय नींव को अच्छी तरह से अभ्यास करना जरूरी है!
ऑनलाइन अनुभव का पता: https://huggingface.co/spaces/Qwen/Qwen2-Math-Demo