DeepSeek-R1-Zero

DeepSeek-R1-Zero एक बड़े पैमाने पर सुदृढ़ीकरण अधिगम से प्रशिक्षित निष्कर्षण मॉडल है, जो उत्कृष्ट निष्कर्षण क्षमता प्राप्त करने के लिए पर्यवेक्षित सूक्ष्म-समायोजन के बिना ही काम करता है।

चीनी चयनप्रोग्रामिंगसुदृढ़ीकरण अधिगमनिष्कर्षण मॉडल
DeepSeek-R1-Zero, DeepSeek टीम द्वारा विकसित एक निष्कर्षण मॉडल है, जो मॉडल की निष्कर्षण क्षमता को सुदृढ़ीकरण अधिगम के माध्यम से बढ़ाने पर केंद्रित है। यह मॉडल बिना किसी पर्यवेक्षित सूक्ष्म-समायोजन के, शक्तिशाली निष्कर्षण व्यवहार प्रदर्शित करता है, जैसे स्व-सत्यापन, चिंतन और लंबी श्रृंखला निष्कर्षण उत्पन्न करना। इसके मुख्य लाभों में कुशल निष्कर्षण क्षमता, पूर्व-प्रशिक्षण के बिना उपयोग करने की क्षमता और गणित, कोड और निष्कर्षण कार्यों में उत्कृष्ट प्रदर्शन शामिल हैं। यह मॉडल DeepSeek-V3 आर्किटेक्चर पर आधारित है, बड़े पैमाने पर निष्कर्षण कार्यों का समर्थन करता है और अनुसंधान और व्यावसायिक अनुप्रयोगों के लिए उपयुक्त है।
वेबसाइट खोलें

DeepSeek-R1-Zero नवीनतम ट्रैफ़िक स्थिति

मासिक कुल विज़िट

29742941

बाउंस दर

44.20%

प्रति विज़िट औसत पृष्ठ

5.9

औसत विज़िट अवधि

00:04:44

DeepSeek-R1-Zero विज़िट प्रवृत्ति

DeepSeek-R1-Zero विज़िट भौगोलिक वितरण

DeepSeek-R1-Zero ट्रैफ़िक स्रोत

DeepSeek-R1-Zero विकल्प