कुणलुन वानवेई ने आधिकारिक तौर पर स्काईवर्क R1V (संक्षेप में "R1V") लॉन्च किया है, जो दुनिया का पहला औद्योगिक बहु-मोडल तर्क मॉडल है। इस मॉडल में 3.8 बिलियन पैरामीटर हैं, और यह प्रसिद्ध क्लोज्ड-सोर्स मॉडल डीपसीक-R1 के प्रदर्शन के करीब है, और कई बेंचमार्क परीक्षणों में इसे पार भी कर गया है, जिससे कई मौजूदा अत्याधुनिक (SOTA) तकनीकों को पीछे छोड़ दिया गया है। कुणलुन वानवेई ने तकनीक के साझाकरण और प्रगति को बढ़ावा देने के लिए R1V को ओपन-सोर्स करने का विकल्प चुना है, जिससे AI के वैश्विक ओपन-सोर्स समुदाय में नई ऊर्जा का संचार हुआ है।
R1V अपनी असाधारण बहु-मोडल तर्क क्षमता के लिए जाना जाता है, जो पाठ और दृश्य जानकारी को पूरी तरह से एकीकृत कर सकता है, जिससे शक्तिशाली बुद्धिमत्ता का प्रदर्शन होता है। विशेष रूप से, दृश्य प्रश्नोत्तर कार्यों में, R1V क्लोज्ड-सोर्स मॉडल जैसे कि Claude3.5Sonnet और GPT-4o के साथ सीधे प्रतिस्पर्धा करता है, और इसमें अग्रणी पाठ तर्क क्षमता भी है। MMMU बेंचमार्क परीक्षण में, R1V ने 69 का उच्च स्कोर प्राप्त किया, जो इसी आकार के मॉडल के लिए एक नया रिकॉर्ड है, और MathVista परीक्षण में भी इसने 67.5 का उत्कृष्ट स्कोर प्राप्त किया, जिससे इसकी जटिल गणितीय तर्क और तार्किक विश्लेषण में शक्तिशाली क्षमता का प्रदर्शन हुआ।
R1V की सफलता कुणलुन वानवेई की अनुसंधान टीम की कई नवीन तकनीकों का परिणाम है। इनमें इंटरमॉडल ट्रांसफर लर्निंग शामिल है, जो बड़े मॉडल की पाठ तर्क क्षमता को प्रभावी ढंग से दृश्य मोड में स्थानांतरित करती है, जिससे बहु-मोडल तर्क डेटा की आवश्यकता में महत्वपूर्ण कमी आती है। इसके अलावा, R1V द्वारा अपनाई गई हाइब्रिड प्रशिक्षण रणनीति, पुनरावृति पर्यवेक्षित ठीक-ट्यूनिंग और प्रबलन सीखने के संयोजन के माध्यम से, गतिशील रूप से विचार श्रृंखला की लंबाई को समायोजित करती है, जिससे तर्क की दक्षता में वृद्धि होती है। उल्लेखनीय रूप से, R1V ने "ओवरथिंकिंग" से बचने के लिए एक अनुकूली लंबाई विचार श्रृंखला आसवन संरचना भी पेश की है, जिससे तर्क की दक्षता और गुणवत्ता में महत्वपूर्ण सुधार हुआ है।
R1V के लॉन्च के साथ, कुणलुन वानवेई न केवल दुनिया की पहली कंपनी बन गई है जिसने एक ओपन-सोर्स बहु-मोडल तर्क मॉडल लॉन्च किया है, बल्कि उसने AGI (आर्टिफिशियल जनरल इंटेलिजेंस) के सपने को साकार करने की दिशा में भी एक महत्वपूर्ण कदम उठाया है। मॉडल वेट, तर्क कोड और तकनीकी रिपोर्ट अब सार्वजनिक रूप से उपलब्ध हैं, और कोई भी व्यक्ति GitHub और Hugging Face के माध्यम से प्रासंगिक संसाधनों तक पहुँच सकता है।
मॉडल वेट डाउनलोड करें
Hugging Face:
https://huggingface.co/Skywork/Skywork-R1V-38B
GitHub:
https://github.com/SkyworkAI/Skywork-R1V
विस्तृत तकनीकी रिपोर्ट
https://github.com/SkyworkAI/Skywork-R1V/blob/main/Skywork_R1V.pdf
हाइलाइट्स:
🌟 स्काईवर्क R1V का आधिकारिक लॉन्च, उद्योग में पहला ओपन-सोर्स बहु-मोडल तर्क मॉडल, जिसमें 3.8 बिलियन पैरामीटर हैं।
🚀 R1V ने कई बेंचमार्क परीक्षणों में असाधारण प्रदर्शन किया है, जिसमें MMMU और MathVista परीक्षणों में क्रमशः 69 और 67.5 के उच्च स्कोर प्राप्त हुए हैं।
📚 कुणलुन वानवेई की ओपन-सोर्स पहल का उद्देश्य तकनीक के साझाकरण को बढ़ावा देना, AI के वैश्विक ओपन-सोर्स समुदाय में जीवन शक्ति का संचार करना और AGI के सपने को साकार करने में योगदान करना है।