लाइट-R1
लाइट-R1 एक ओपन-सोर्स प्रोजेक्ट है जो लंबी श्रृंखला तर्क (लॉन्ग COT) पर केंद्रित है, जो पाठ्यक्रम-आधारित SFT, DPO और RL के माध्यम से शुरुआत से प्रशिक्षण विधि प्रदान करता है।
सामान्य उत्पादप्रोग्रामिंगकृत्रिम बुद्धिमत्तालंबी श्रृंखला तर्क
लाइट-R1 Qihoo360 द्वारा विकसित एक ओपन-सोर्स प्रोजेक्ट है, जिसका उद्देश्य पाठ्यक्रम-आधारित पर्यवेक्षित ठीक-ट्यूनिंग (SFT), प्रत्यक्ष वरीयता अनुकूलन (DPO) और प्रबलित अधिगम (RL) के माध्यम से लंबी श्रृंखला तर्क मॉडल को प्रशिक्षित करना है। यह प्रोजेक्ट डेटासेट को शुद्ध करके और कुशल प्रशिक्षण विधियों का उपयोग करके, शुरुआत से ही लंबी श्रृंखला तर्क क्षमता प्राप्त करता है। इसके मुख्य लाभों में ओपन-सोर्स प्रशिक्षण डेटा, कम लागत वाली प्रशिक्षण विधि और गणितीय तर्क क्षेत्र में उत्कृष्ट प्रदर्शन शामिल हैं। यह प्रोजेक्ट वर्तमान लंबी श्रृंखला तर्क मॉडल प्रशिक्षण आवश्यकताओं पर आधारित है, जिसका उद्देश्य एक पारदर्शी और पुनरावृत्ति योग्य प्रशिक्षण विधि प्रदान करना है। यह प्रोजेक्ट वर्तमान में मुफ्त और ओपन-सोर्स है, जो अनुसंधान संस्थानों और डेवलपर्स के लिए उपयुक्त है।
लाइट-R1 नवीनतम ट्रैफ़िक स्थिति
मासिक कुल विज़िट
474564576
बाउंस दर
36.20%
प्रति विज़िट औसत पृष्ठ
6.1
औसत विज़िट अवधि
00:06:34