लाइट-R1

लाइट-R1 एक ओपन-सोर्स प्रोजेक्ट है जो लंबी श्रृंखला तर्क (लॉन्ग COT) पर केंद्रित है, जो पाठ्यक्रम-आधारित SFT, DPO और RL के माध्यम से शुरुआत से प्रशिक्षण विधि प्रदान करता है।

सामान्य उत्पादप्रोग्रामिंगकृत्रिम बुद्धिमत्तालंबी श्रृंखला तर्क
लाइट-R1 Qihoo360 द्वारा विकसित एक ओपन-सोर्स प्रोजेक्ट है, जिसका उद्देश्य पाठ्यक्रम-आधारित पर्यवेक्षित ठीक-ट्यूनिंग (SFT), प्रत्यक्ष वरीयता अनुकूलन (DPO) और प्रबलित अधिगम (RL) के माध्यम से लंबी श्रृंखला तर्क मॉडल को प्रशिक्षित करना है। यह प्रोजेक्ट डेटासेट को शुद्ध करके और कुशल प्रशिक्षण विधियों का उपयोग करके, शुरुआत से ही लंबी श्रृंखला तर्क क्षमता प्राप्त करता है। इसके मुख्य लाभों में ओपन-सोर्स प्रशिक्षण डेटा, कम लागत वाली प्रशिक्षण विधि और गणितीय तर्क क्षेत्र में उत्कृष्ट प्रदर्शन शामिल हैं। यह प्रोजेक्ट वर्तमान लंबी श्रृंखला तर्क मॉडल प्रशिक्षण आवश्यकताओं पर आधारित है, जिसका उद्देश्य एक पारदर्शी और पुनरावृत्ति योग्य प्रशिक्षण विधि प्रदान करना है। यह प्रोजेक्ट वर्तमान में मुफ्त और ओपन-सोर्स है, जो अनुसंधान संस्थानों और डेवलपर्स के लिए उपयुक्त है।
वेबसाइट खोलें

लाइट-R1 नवीनतम ट्रैफ़िक स्थिति

मासिक कुल विज़िट

474564576

बाउंस दर

36.20%

प्रति विज़िट औसत पृष्ठ

6.1

औसत विज़िट अवधि

00:06:34

लाइट-R1 विज़िट प्रवृत्ति

लाइट-R1 विज़िट भौगोलिक वितरण

लाइट-R1 ट्रैफ़िक स्रोत

लाइट-R1 विकल्प