हाल ही में, बीजिंग मूनज़ डार्क साइड टेक्नोलॉजी कंपनी ने घोषणा की कि उसके स्मार्ट सहायक Kimi ने एक महत्वपूर्ण तकनीकी उन्नति का अनुभव किया है, जिसमें नया k1.5 मल्टी-मोडल थिंकिंग मॉडल लॉन्च किया गया है। यह मॉडल मल्टी-मोडल और सामान्य तर्क क्षमता में उद्योग में अग्रणी स्तर पर पहुंच गया है, जो Kimi के लिए आर्टिफिशियल इंटेलिजेंस के क्षेत्र में एक और महत्वपूर्ण प्रगति का प्रतीक है।

k1.5 मल्टी-मोडल थिंकिंग मॉडल Kimi द्वारा केवल तीन महीने में उसके k श्रृंखला के मजबूत शिक्षण मॉडल का तीसरा बड़ा उन्नयन है। पिछले नवंबर में जारी k0-math गणित मॉडल और दिसंबर में जारी k1 दृष्टि सोच मॉडल के बाद, k1.5 मॉडल बेंचमार्क परीक्षणों में उत्कृष्ट प्रदर्शन कर रहा है। short-CoT मोड में, k1.5 की गणित, कोड, दृश्य मल्टी-मोडल और सामान्य क्षमता ने वैश्विक स्तर पर शॉर्ट थिंकिंग SOTA मॉडल GPT-4o और Claude3.5Sonnet के स्तर को 550% तक पीछे छोड़ दिया है। जबकि long-CoT मोड में, k1.5 की गणित, कोड और मल्टी-मोडल तर्क क्षमता ने OpenAI o1 के लंबे विचार SOTA मॉडल के स्तर को भी प्राप्त कर लिया है, जो कि OpenAI के बाहर किसी कंपनी द्वारा o1 के आधिकारिक संस्करण की मल्टी-मोडल तर्क प्रदर्शन को प्राप्त करने का पहला अवसर है।

इस उन्नयन के पीछे Kimi तकनीकी टीम की निरंतर मेहनत और नवाचार है। टीम ने पहली बार विस्तृत मॉडल प्रशिक्षण तकनीकी रिपोर्ट "Kimi k1.5: बड़े भाषा मॉडल की मदद से मजबूत शिक्षण का स्केलिंग" का खुलासा किया, जो नए तकनीकी पैटर्न के तहत मॉडल प्रशिक्षण की खोज का दस्तावेज है।

微信截图_20250121082016.png

रिपोर्ट में बताया गया है कि k1.5 मॉडल की प्रमुख नवाचारों में लंबे संदर्भ का विस्तार, आंशिक विस्तारण तकनीक के माध्यम से प्रशिक्षण दक्षता में सुधार शामिल है, साथ ही संदर्भ की लंबाई में वृद्धि से मॉडल प्रदर्शन में निरंतर सुधार देखने को मिला है। इसके अलावा, बेहतर रणनीति अनुकूलन विधियाँ और सरल ढांचा डिजाइन ने मॉडल के मजबूत प्रदर्शन को समर्थन दिया है। यह ध्यान देने योग्य है कि k1.5 मॉडल ने पाठ और दृश्य डेटा पर संयुक्त प्रशिक्षण किया है, जिसमें दोनों मोडों के संयुक्त तर्क की क्षमता है, विशेष रूप से गणितीय क्षमता में उत्कृष्टता दिखाई है, हालांकि कुछ ग्राफिकल समझ पर निर्भर ज्यामितीय प्रश्नों को संभालने में चुनौतियाँ बनी हुई हैं।

छोटे लिंक सोच तर्क क्षमता को और बढ़ाने के लिए, टीम ने प्रभावी long2short विधि का प्रस्ताव दिया, जिसने Long-CoT तकनीक का उपयोग करके Short-CoT मॉडल में सुधार किया, और AIME, MATH500 और LiveCodeBench जैसे परीक्षणों में महत्वपूर्ण परिणाम प्राप्त किए, जो मौजूदा छोटे लिंक सोच मॉडल जैसे GPT-4 और Claude Sonnet3.5 को काफी पीछे छोड़ दिया।

k1.5 मल्टी-मोडल थिंकिंग मॉडल का पूर्वावलोकन धीरे-धीरे Kimi.com वेबसाइट और नवीनतम संस्करण के Kimi स्मार्ट सहायक ऐप पर ऑनलाइन होगा। उपयोगकर्ता यदि मॉडल स्विच बटन का पता लगाते हैं, तो वे इस नए उन्नत मॉडल का अनुभव कर सकते हैं। k1.5 मॉडल गहन तर्क में कुशल है, जो उपयोगकर्ताओं को जटिल कोड समस्याओं, गणितीय समस्याओं और कार्य संबंधी चुनौतियों को हल करने में मदद कर सकता है।

मूनज़ डार्क साइड टेक्नोलॉजी कंपनी ने कहा कि 2025 में वह निर्धारित रोडमैप के अनुसार k श्रृंखला के मजबूत शिक्षण मॉडल को तेज गति से उन्नत करना जारी रखेगी, जिसमें अधिक मोड, अधिक क्षेत्रों की क्षमताएँ और अधिक मजबूत सामान्य क्षमताएँ लाएगी, ताकि उपयोगकर्ताओं के लिए और अधिक संभावनाएँ खोली जा सकें।

गिटहब रिपोर्ट लिंक:https://github.com/MoonshotAI/kimi-k1.5