चंद्रमा के अंधेरे पक्ष ने आज नए दृश्य सोच मॉडल k1 के लॉन्च की घोषणा की। यह मॉडल सुदृढ़ीकरण शिक्षण तकनीक पर आधारित है, जो न केवल एंड-टू-एंड छवि समझ का समर्थन करता है, बल्कि सोचने की श्रृंखला तकनीक को भी एकीकृत करता है, जिससे इसकी क्षमताएँ गणित के अलावा अन्य मूलभूत विज्ञान क्षेत्रों जैसे भौतिकी और रसायन शास्त्र में विस्तारित होती हैं। बेंचमार्क क्षमता परीक्षण में, k1 मॉडल ने OpenAI के o1, GPT-4o और Claude3.5Sonnet जैसे वैश्विक अग्रणी बेंचमार्क मॉडलों को पार कर लिया।
नई पीढ़ी का मॉडल अधिक विस्तृत तर्क चरण उत्पन्न करने के लिए प्रोत्साहित करता है, उच्च गुणवत्ता की सोच श्रृंखला बनाता है, और जटिल कार्यों को हल करने की सफलता दर को महत्वपूर्ण रूप से बढ़ाता है। Kimi का k1 मॉडल छवि समझ और सोचने की क्षमताओं का संयोजन करते हुए उपयोगकर्ताओं को एक अधिक सहज इंटरैक्टिव अनुभव प्रदान करता है, जो सीधे उपयोगकर्ता द्वारा इनपुट की गई छवि जानकारी को संसाधित कर सकता है और बिना बाहरी OCR या अतिरिक्त दृश्य मॉडलों की सहायता के उत्तर प्राप्त कर सकता है।
k1 मॉडल का प्रशिक्षण दो चरणों में विभाजित है, पहले पूर्व-प्रशिक्षण द्वारा मूल मॉडल प्राप्त करना, और फिर इसके आधार पर सुदृढ़ीकरण शिक्षण के बाद प्रशिक्षण करना। मूल मॉडल ने OCRBench पर 903 अंकों का उत्कृष्ट स्कोर प्राप्त किया, और MathVista-testmini, MMMU-val और DocVQA बेंचमार्क परीक्षण सेटों में उत्कृष्ट प्रदर्शन किया। सुदृढ़ीकरण शिक्षण के बाद के प्रशिक्षण ने डेटा गुणवत्ता और शिक्षण दक्षता के मामले में अनुकूलन किया, जिससे पैमाने पर एक नई सफलता हासिल हुई।
Kimi ने एक मानकीकृत परीक्षण सेट Science Vista भी स्वायत्त रूप से बनाया है, जो विभिन्न कठिनाई के गणित और विज्ञान के चित्र प्रश्नों को शामिल करता है, और इसे पूरी उद्योग के लिए उपलब्ध कराया जाएगा। हालांकि k1 मॉडल ने आंतरिक परीक्षण में कुछ सीमाओं को दिखाया, जैसे वितरण से बाहर सामान्यीकरण और जटिल समस्याओं पर सफलता दर में सुधार की गुंजाइश, लेकिन दृश्य शोर परिदृश्यों में इसका प्रदर्शन अन्य मॉडलों की तुलना में बेहतर है, जो इसकी अत्यधिक दृश्य पहचान क्षमता को दर्शाता है।
Kimi स्मार्ट सहायक का k1 दृश्य सोच मॉडल न केवल गणित के क्षेत्र में उत्कृष्ट प्रदर्शन करता है, बल्कि भौतिकी और रसायन विज्ञान के क्षेत्रों में भी विस्तारित होता है, जो व्यापक मूलभूत विज्ञान क्षमताओं को प्रदर्शित करता है। इसके अलावा, k1 मॉडल सामान्य क्षमताओं को भी प्रदर्शित करता है, जो गैर-गणितीय समस्याओं जैसे वैज्ञानिकों के पांडुलिपियों की सामग्री और पृष्ठभूमि कहानी को स्पष्ट और तर्कित कर सकता है।
Kimi स्मार्ट सहायक उपयोगकर्ताओं के साथ एक बड़े विश्व की खोज की उम्मीद करता है, नया k1 मॉडल लाइव हो चुका है, और उपयोगकर्ता नवीनतम Kimi स्मार्ट सहायक मोबाइल ऐप या वेब संस्करण के माध्यम से इस नई सुविधा का अनुभव कर सकते हैं।