चीन के प्राइवेट इक्विटी दिग्गज ह्वानफांग क्वांट के तहत डीपसीक ने हाल ही में अपना नवीनतम तर्क-केंद्रित बड़े भाषा मॉडल R1-Lite-Preview जारी किया है। यह मॉडल वर्तमान में केवल डीपसीक चैट नामक वेब चैटबॉट प्लेटफॉर्म के माध्यम से जनता के लिए उपलब्ध है।  

image.png

डीपसीक अपने ओपन-सोर्स एआई इकोसिस्टम में नवाचार योगदान के लिए जाना जाता है, और यह नया विमोचन जनता को उच्च स्तर की तर्क क्षमता प्रदान करने के लिए है, जबकि इसकी पहुंच और पारदर्शिता के प्रति प्रतिबद्धता को बनाए रखा गया है। हालांकि R1-Lite-Preview वर्तमान में केवल चैट एप्लिकेशन में उपलब्ध है, लेकिन इसकी प्रदर्शन ने ओपनएआई के हालिया जारी किए गए o1-preview मॉडल के समान या उससे बेहतर प्रदर्शन के कारण व्यापक ध्यान आकर्षित किया है।  

R1-Lite-Preview "चेन थिंकिंग" तर्क का उपयोग करता है, जो उपयोगकर्ता के प्रश्नों के उत्तर देते समय इसके द्वारा अनुभव की गई विभिन्न सोच प्रक्रियाओं को प्रदर्शित कर सकता है।

हालांकि कुछ सोच की श्रृंखलाएँ मानव के लिए बेतुकी या गलत लग सकती हैं, लेकिन समग्र रूप से, R1-Lite-Preview के उत्तर बहुत सटीक हैं, और यह कुछ पारंपरिक शक्तिशाली एआई मॉडल जैसे GPT-4o और क्लॉड श्रृंखला द्वारा सामना की गई "फंदे" समस्याओं को हल करने में सक्षम है, जैसे "स्ट्रॉबेरी" शब्द में कितने 'R' अक्षर हैं? "9.11 और 9.9 में से कौन बड़ा है?"  

डीपसीक के अनुसार, यह मॉडल तर्क के तर्क, गणितीय सोच और वास्तविक समय की समस्या समाधान कार्यों में उत्कृष्ट प्रदर्शन करता है। इसके प्रदर्शन ने AIME (अमेरिकी आमंत्रण गणित परीक्षा) और MATH जैसे स्थापित मानक परीक्षणों में ओपनएआई o1-preview के स्तर को पार कर लिया है।  

image.png

इसके अलावा, डीपसीक ने मॉडल के विस्तारित डेटा को जारी किया है, जो दिखाता है कि जब मॉडल को समस्याओं को हल करने के लिए अधिक समय या "सोचने के टोकन" दिए जाते हैं, तो इसकी सटीकता में निरंतर सुधार होता है। चार्ट ने यह स्पष्ट किया है कि सोच की गहराई बढ़ने के साथ, इस मॉडल ने AIME जैसे मानकों पर अपने स्कोर में वृद्धि की है।  

वर्तमान में, R1-Lite-Preview का विमोचन महत्वपूर्ण मानकों में उत्कृष्ट प्रदर्शन कर रहा है, जो जटिल गणित से लेकर तार्किक परिदृश्यों तक के कार्यों की एक श्रृंखला को संभालने में सक्षम है, और इसके स्कोर शीर्ष तर्क मॉडल जैसे GPQA और Codeforces के बराबर है। इस मॉडल की पारदर्शी तर्क प्रक्रिया उपयोगकर्ताओं को इसके तर्क कदमों को वास्तविक समय में देखने की अनुमति देती है, जो सिस्टम की जिम्मेदारी और विश्वसनीयता को बढ़ाती है।  

image.png

यह ध्यान देने योग्य है कि डीपसीक ने तीसरे पक्ष के स्वतंत्र विश्लेषण या मानक परीक्षण के लिए पूर्ण कोड जारी नहीं किया है, और न ही स्वतंत्र परीक्षण के लिए एपीआई इंटरफेस प्रदान किया है, कंपनी ने R1-Lite-Preview के प्रशिक्षण या निर्माण के बारे में संबंधित ब्लॉग लेख या तकनीकी दस्तावेज़ जारी नहीं किया है, जिससे इसके पीछे की उत्पत्ति अभी भी सवालों के घेरे में है।  

R1-Lite-Preview वर्तमान में डीपसीक चैट (chat.deepseek.com) के माध्यम से मुफ्त में उपलब्ध है, लेकिन इसका प्रीमियम "डीप थॉट" मोड प्रति दिन 50 संदेशों तक सीमित है, जिससे उपयोगकर्ता इसकी शक्तिशाली क्षमताओं का अनुभव कर सकते हैं। डीपसीक R1 श्रृंखला मॉडल के ओपन-सोर्स संस्करण और संबंधित एपीआई को जारी करने की योजना बना रहा है, ताकि ओपन-सोर्स एआई समुदाय के विकास का और समर्थन किया जा सके।  

डीपसीक ओपन-सोर्स एआई क्षेत्र में नवाचार को बढ़ावा देना जारी रखता है, R1-Lite-Preview का विमोचन तर्क और स्केलेबिलिटी के मामले में नए आयाम जोड़ता है। जैसे-जैसे कंपनियाँ और शोधकर्ता तर्क-गहन एआई के अनुप्रयोगों का अन्वेषण करते हैं, डीपसीक की खुली प्रतिबद्धता सुनिश्चित करेगी कि इसके मॉडल विकास और नवाचार के लिए एक महत्वपूर्ण संसाधन बनें।

आधिकारिक प्रवेश: https://www.deepseek.com/

मुख्य बिंदु:  

🌟 डीपसीक ने R1-Lite-Preview मॉडल जारी किया, प्रदर्शन ओपनएआई o1 के समान और उससे बेहतर।  

📊 मॉडल पारदर्शी तर्क प्रक्रिया प्रदर्शित करता है, उपयोगकर्ता वास्तविक समय में तर्क कदम देख सकते हैं।  

🔍 गहन अध्ययन और तार्किक तर्क क्षमताएँ महत्वपूर्ण हैं, भविष्य में ओपन-सोर्स संस्करण और एपीआई जारी किए जाएंगे।