चंद्रमा के अंधेरे पक्ष ने आज नए दृश्य सोच मॉडल k1 के लॉन्च की घोषणा की। यह मॉडल सुदृढ़ीकरण शिक्षण तकनीक पर आधारित है, जो न केवल एंड-टू-एंड छवि समझ का समर्थन करता है, बल्कि सोचने की श्रृंखला तकनीक को भी एकीकृत करता है, जिससे इसकी क्षमताएँ गणित के अलावा अन्य मूलभूत विज्ञान क्षेत्रों जैसे भौतिकी और रसायन शास्त्र में विस्तारित होती हैं। बेंचमार्क क्षमता परीक्षण में, k1 मॉडल ने OpenAI के o1, GPT-4o और Claude3.5Sonnet जैसे वैश्विक अग्रणी बेंचमार्क मॉडलों को पार कर लिया।

नई पीढ़ी का मॉडल अधिक विस्तृत तर्क चरण उत्पन्न करने के लिए प्रोत्साहित करता है, उच्च गुणवत्ता की सोच श्रृंखला बनाता है, और जटिल कार्यों को हल करने की सफलता दर को महत्वपूर्ण रूप से बढ़ाता है। Kimi का k1 मॉडल छवि समझ और सोचने की क्षमताओं का संयोजन करते हुए उपयोगकर्ताओं को एक अधिक सहज इंटरैक्टिव अनुभव प्रदान करता है, जो सीधे उपयोगकर्ता द्वारा इनपुट की गई छवि जानकारी को संसाधित कर सकता है और बिना बाहरी OCR या अतिरिक्त दृश्य मॉडलों की सहायता के उत्तर प्राप्त कर सकता है।

微信截图_20241216100218.png

k1 मॉडल का प्रशिक्षण दो चरणों में विभाजित है, पहले पूर्व-प्रशिक्षण द्वारा मूल मॉडल प्राप्त करना, और फिर इसके आधार पर सुदृढ़ीकरण शिक्षण के बाद प्रशिक्षण करना। मूल मॉडल ने OCRBench पर 903 अंकों का उत्कृष्ट स्कोर प्राप्त किया, और MathVista-testmini, MMMU-val और DocVQA बेंचमार्क परीक्षण सेटों में उत्कृष्ट प्रदर्शन किया। सुदृढ़ीकरण शिक्षण के बाद के प्रशिक्षण ने डेटा गुणवत्ता और शिक्षण दक्षता के मामले में अनुकूलन किया, जिससे पैमाने पर एक नई सफलता हासिल हुई।

Kimi ने एक मानकीकृत परीक्षण सेट Science Vista भी स्वायत्त रूप से बनाया है, जो विभिन्न कठिनाई के गणित और विज्ञान के चित्र प्रश्नों को शामिल करता है, और इसे पूरी उद्योग के लिए उपलब्ध कराया जाएगा। हालांकि k1 मॉडल ने आंतरिक परीक्षण में कुछ सीमाओं को दिखाया, जैसे वितरण से बाहर सामान्यीकरण और जटिल समस्याओं पर सफलता दर में सुधार की गुंजाइश, लेकिन दृश्य शोर परिदृश्यों में इसका प्रदर्शन अन्य मॉडलों की तुलना में बेहतर है, जो इसकी अत्यधिक दृश्य पहचान क्षमता को दर्शाता है।

Kimi स्मार्ट सहायक का k1 दृश्य सोच मॉडल न केवल गणित के क्षेत्र में उत्कृष्ट प्रदर्शन करता है, बल्कि भौतिकी और रसायन विज्ञान के क्षेत्रों में भी विस्तारित होता है, जो व्यापक मूलभूत विज्ञान क्षमताओं को प्रदर्शित करता है। इसके अलावा, k1 मॉडल सामान्य क्षमताओं को भी प्रदर्शित करता है, जो गैर-गणितीय समस्याओं जैसे वैज्ञानिकों के पांडुलिपियों की सामग्री और पृष्ठभूमि कहानी को स्पष्ट और तर्कित कर सकता है।

Kimi स्मार्ट सहायक उपयोगकर्ताओं के साथ एक बड़े विश्व की खोज की उम्मीद करता है, नया k1 मॉडल लाइव हो चुका है, और उपयोगकर्ता नवीनतम Kimi स्मार्ट सहायक मोबाइल ऐप या वेब संस्करण के माध्यम से इस नई सुविधा का अनुभव कर सकते हैं।