k1 श्रृंखला प्रेरक अध्ययन मॉडल का आगमन! चंद्रमा के अंधेरे पक्ष Kimi ने दृश्य सोच मॉडल लॉन्च किया

AIbase基地

द्वारा प्रकाशितAI समाचार · 5 मिनट पढ़ें · Dec 16, 2024

379

चंद्रमा के अंधेरे पक्ष ने आज नए दृश्य सोच मॉडल k1 के लॉन्च की घोषणा की। यह मॉडल सुदृढ़ीकरण शिक्षण तकनीक पर आधारित है, जो न केवल एंड-टू-एंड छवि समझ का समर्थन करता है, बल्कि सोचने की श्रृंखला तकनीक को भी एकीकृत करता है, जिससे इसकी क्षमताएँ गणित के अलावा अन्य मूलभूत विज्ञान क्षेत्रों जैसे भौतिकी और रसायन शास्त्र में विस्तारित होती हैं। बेंचमार्क क्षमता परीक्षण में, k1 मॉडल ने OpenAI के o1, GPT-4o और Claude3.5Sonnet जैसे वैश्विक अग्रणी बेंचमार्क मॉडलों को पार कर लिया।

नई पीढ़ी का मॉडल अधिक विस्तृत तर्क चरण उत्पन्न करने के लिए प्रोत्साहित करता है, उच्च गुणवत्ता की सोच श्रृंखला बनाता है, और जटिल कार्यों को हल करने की सफलता दर को महत्वपूर्ण रूप से बढ़ाता है। Kimi का k1 मॉडल छवि समझ और सोचने की क्षमताओं का संयोजन करते हुए उपयोगकर्ताओं को एक अधिक सहज इंटरैक्टिव अनुभव प्रदान करता है, जो सीधे उपयोगकर्ता द्वारा इनपुट की गई छवि जानकारी को संसाधित कर सकता है और बिना बाहरी OCR या अतिरिक्त दृश्य मॉडलों की सहायता के उत्तर प्राप्त कर सकता है।

微信截图_20241216100218.png

k1 मॉडल का प्रशिक्षण दो चरणों में विभाजित है, पहले पूर्व-प्रशिक्षण द्वारा मूल मॉडल प्राप्त करना, और फिर इसके आधार पर सुदृढ़ीकरण शिक्षण के बाद प्रशिक्षण करना। मूल मॉडल ने OCRBench पर 903 अंकों का उत्कृष्ट स्कोर प्राप्त किया, और MathVista-testmini, MMMU-val और DocVQA बेंचमार्क परीक्षण सेटों में उत्कृष्ट प्रदर्शन किया। सुदृढ़ीकरण शिक्षण के बाद के प्रशिक्षण ने डेटा गुणवत्ता और शिक्षण दक्षता के मामले में अनुकूलन किया, जिससे पैमाने पर एक नई सफलता हासिल हुई।

Kimi ने एक मानकीकृत परीक्षण सेट Science Vista भी स्वायत्त रूप से बनाया है, जो विभिन्न कठिनाई के गणित और विज्ञान के चित्र प्रश्नों को शामिल करता है, और इसे पूरी उद्योग के लिए उपलब्ध कराया जाएगा। हालांकि k1 मॉडल ने आंतरिक परीक्षण में कुछ सीमाओं को दिखाया, जैसे वितरण से बाहर सामान्यीकरण और जटिल समस्याओं पर सफलता दर में सुधार की गुंजाइश, लेकिन दृश्य शोर परिदृश्यों में इसका प्रदर्शन अन्य मॉडलों की तुलना में बेहतर है, जो इसकी अत्यधिक दृश्य पहचान क्षमता को दर्शाता है।

Kimi स्मार्ट सहायक का k1 दृश्य सोच मॉडल न केवल गणित के क्षेत्र में उत्कृष्ट प्रदर्शन करता है, बल्कि भौतिकी और रसायन विज्ञान के क्षेत्रों में भी विस्तारित होता है, जो व्यापक मूलभूत विज्ञान क्षमताओं को प्रदर्शित करता है। इसके अलावा, k1 मॉडल सामान्य क्षमताओं को भी प्रदर्शित करता है, जो गैर-गणितीय समस्याओं जैसे वैज्ञानिकों के पांडुलिपियों की सामग्री और पृष्ठभूमि कहानी को स्पष्ट और तर्कित कर सकता है।

Kimi स्मार्ट सहायक उपयोगकर्ताओं के साथ एक बड़े विश्व की खोज की उम्मीद करता है, नया k1 मॉडल लाइव हो चुका है, और उपयोगकर्ता नवीनतम Kimi स्मार्ट सहायक मोबाइल ऐप या वेब संस्करण के माध्यम से इस नई सुविधा का अनुभव कर सकते हैं।

किमी k1.6 मॉडल का खुलासा: GPT-3 से आगे निकलने वाली प्रोग्रामिंग क्षमता, AI में नई लहर

हाल ही में, विश्व प्रसिद्ध गतिशील बेंचमार्किंग प्लेटफ़ॉर्म LiveCodeBench से मिली जानकारी के अनुसार, किमी के नए जारी किए गए k1.6 मॉडल ने प्रोग्रामिंग क्षमता में असाधारण प्रदर्शन किया है और OpenAI के GPT-3 (o3mini और o1 जैसे संस्करणों सहित) को पीछे छोड़ते हुए प्रदर्शन रैंकिंग में पहले स्थान पर पहुँच गया है। इस खबर ने निस्संदेह तकनीकी जगत में उत्साह और अपेक्षाओं को जगा दिया है। मूनशैडो के शोधकर्ता फ़्लड के अनुसार, k1.6 को k1.5 के आधार पर प्रशिक्षित और अनुकूलित किया गया है।

चाँद की अंधी तरफ का रहस्योद्घाटन o1:Long-CoT कुंजी है, मॉडल सोच में "लंबे समय तक इंतजार करना" आवश्यक है

चाँद की अंधी तरफ के शोधकर्ता Flood Sung ने हाल ही में एक लंबा लेख प्रकाशित किया, जिसमें उन्होंने पहली बार k1.5 मॉडल के विकास का विचार विस्तार से साझा किया और OpenAI o1 मॉडल से प्राप्त तकनीकी अंतर्दृष्टियों पर गहराई से विचार किया। Flood Sung के अनुसार, Long-CoT (लंबी श्रृंखला विचार) का महत्व वास्तव में एक साल से अधिक समय पहले चाँद की अंधी तरफ के सह-संस्थापक Tim Zhou Xinyu द्वारा सत्यापित किया गया था। छोटे मॉडल का उपयोग करके बहु-अंक गणना के लिए प्रशिक्षण दिया गया और सूक्ष्म गणना प्रक्रिया को लंबे श्रृंखलागत विचार डेटा में परिवर्तित कर SFT (प्रशिक्षित सूश्रीकरण) में लागू किया गया।

चाँद की अंधी तरफ ने नया SOTA मॉडल k1.5 जारी किया: मल्टी-मॉडल रीजनिंग क्षमता में और सुधार

चाँद की अंधी तरफ कंपनी ने अपने नए SOTA (state-of-the-art) मॉडल - k1.5 मल्टी-मॉडल सोच मॉडल का भव्य विमोचन किया, जो मल्टी-मॉडल रीजनिंग और सामान्य रीजनिंग क्षेत्र में महत्वपूर्ण प्रगति का प्रतीक है। यह मॉडल न केवल उत्कृष्ट मल्टी-मॉडल प्रोसेसिंग क्षमताओं से लैस है, बल्कि यह उत्कृष्ट सामान्य रीजनिंग क्षमताओं का प्रदर्शन भी करता है, जिससे यह विभिन्न जटिल कार्यों का सामना करने में सक्षम है। k1.5 मॉडल की सबसे बड़ी विशेषता इसकी मल्टी-मॉडल रीजनिंग क्षमता है। यह टेक्स्ट, इमेज, साउंड आदि अलग-अलग मॉडल से जानकारी को एक साथ प्रोसेस कर सकता है, जिससे यह अधिक व्यापक और सटीक जानकारी प्रदान करता है।

Kimi ने नए SOTA मॉडल का विमोचन किया: k1.5 मल्टी-मोडल सोच मॉडल का आगमन

हाल ही में, बीजिंग युएज़ि दार्क साइड टेक्नोलॉजी कं, लि. ने घोषणा की कि इसके स्मार्ट सहायक Kimi को एक महत्वपूर्ण तकनीकी उन्नति मिली है, जो कि नए k1.5 मल्टी-मोडल सोच मॉडल का विमोचन कर रहा है। यह मॉडल मल्टी-मोडल निष्कर्षण और सामान्य निष्कर्षण क्षमताओं में उद्योग स्तर पर अग्रणी है, जो Kimi के लिए आर्टिफिशियल इंटेलिजेंस के क्षेत्र में एक और महत्वपूर्ण विकास का प्रतीक है।

AI समाचार

k1 श्रृंखला प्रेरक अध्ययन मॉडल का आगमन! चंद्रमा के अंधेरे पक्ष Kimi ने दृश्य सोच मॉडल लॉन्च किया

AIbase基地

संबंधित AI समाचार अनुशंसाएँ

किमी k1.6 मॉडल का खुलासा: GPT-3 से आगे निकलने वाली प्रोग्रामिंग क्षमता, AI में नई लहर

चाँद की अंधी तरफ का रहस्योद्घाटन o1:Long-CoT कुंजी है, मॉडल सोच में "लंबे समय तक इंतजार करना" आवश्यक है

चाँद की अंधी तरफ ने नया SOTA मॉडल k1.5 जारी किया: मल्टी-मॉडल रीजनिंग क्षमता में और सुधार

Kimi ने नए SOTA मॉडल का विमोचन किया: k1.5 मल्टी-मोडल सोच मॉडल का आगमन