हाल ही में, Tencent Cloud TI प्लेटफॉर्म ने बहुप्रतीक्षित DeepSeek श्रृंखला मॉडल को आधिकारिक रूप से लॉन्च करने की घोषणा की है, जिसमें 671B के पैरामीटर वाले "पूर्ण शक्ति" V3 और R1 मूल मॉडल शामिल हैं, साथ ही DeepSeek-R1 के आसवन से प्राप्त श्रृंखला मॉडल, जिनके पैरामीटर का आकार 70B से 1.5B तक है। यह कदम डेवलपर्स को शक्तिशाली AI टूल समर्थन प्रदान करता है, जो बड़े मॉडल तकनीक के प्रसार और उपयोग को और बढ़ावा देता है।

DeepSeek श्रृंखला मॉडल अपनी उत्कृष्ट प्रदर्शन के कारण वैश्विक स्तर पर व्यापक ध्यान आकर्षित कर रहा है। इसमें, DeepSeek-R1 को रिलीज़ करते समय ओपन-सोर्स किया गया था, और इसके बाद के प्रशिक्षण चरण में बड़े पैमाने पर सुदृढीकरण शिक्षण तकनीक का उपयोग किया गया था, जिससे कि केवल अत्यधिक सीमित लेबल डेटा के बावजूद, मॉडल की अनुमानित क्षमता में काफी वृद्धि हो सके। गणित, कोड, प्राकृतिक भाषा अनुमान जैसे कार्यों में, DeepSeek-R1 का प्रदर्शन OpenAI के GPT-4 के आधिकारिक संस्करण के समान है। इसके अलावा, DeepSeek-R1 MIT लाइसेंस का पालन करता है, जो उपयोगकर्ताओं को आसवन तकनीक के माध्यम से अन्य मॉडल को प्रशिक्षित करने की अनुमति देता है, और इसका आसवित मॉडल DeepSeek-R1-Distill पैरामीटर के छोटे आकार और अनुमान लागत के कम होने के बावजूद बेंचमार्क परीक्षणों में उत्कृष्ट प्रदर्शन करता है।

微信截图_20250204143205.png

Tencent Cloud TI प्लेटफॉर्म न केवल DeepSeek श्रृंखला मॉडल के एक-क्लिक तैनाती का पूरी तरह से समर्थन करता है, बल्कि R1 मॉडल के लिए सीमित समय के लिए मुफ्त ऑनलाइन अनुभव भी प्रदान करता है, जिससे डेवलपर्स को बिना किसी बाधा के खोलने का अनुभव मिलता है। उपयोगकर्ता "TI प्लेटफॉर्म- बड़े मॉडल प्लाजा" में DeepSeek श्रृंखला मॉडल कार्ड पर क्लिक करके मॉडल की जानकारी प्राप्त कर सकते हैं, और ऑनलाइन अनुभव और एक-क्लिक तैनाती कर सकते हैं। इसके अलावा, TI प्लेटफॉर्म मॉडल सेवा प्रबंधन, संचालन की निगरानी, संसाधन स्केलिंग जैसे उद्यम स्तर की क्षमताएं भी प्रदान करता है, जिससे कंपनियों और डेवलपर्स को DeepSeek मॉडल को प्रभावी और स्थिर तरीके से वास्तविक व्यवसाय में शामिल करने में मदद मिलती है।

विभिन्न उपयोगकर्ताओं की आवश्यकताओं को पूरा करने के लिए, TI प्लेटफॉर्म कई बिलिंग मोड प्रदान करता है, जिसमें उपयोग के अनुसार बिलिंग और वार्षिक/मासिक पैकेज शामिल हैं। जिन उपयोगकर्ताओं को थोड़े समय के अनुभव की आवश्यकता है, वे सीधे TI प्लेटफॉर्म से कंप्यूटिंग शक्ति खरीद सकते हैं और उपयोग के अनुसार बिलिंग मोड का चयन कर सकते हैं; जबकि जो पहले से CVM मशीन खरीद चुके हैं या लंबे समय तक अनुभव की आवश्यकता है, उनके लिए अपनी CVM मशीन को अनुमानित शक्ति के रूप में उपयोग करने की सिफारिश की जाती है। कंप्यूटिंग शक्ति की कॉन्फ़िगरेशन के संदर्भ में, "पूर्ण शक्ति" DeepSeek-R1 के लिए Tencent Cloud पर 2 8-कार्ड HCCPNV6 मॉडल का उपयोग करने की सिफारिश की जाती है ताकि स्थिर व्यवसाय अनुभव प्राप्त किया जा सके; जबकि आसवित DeepSeek-R1-Distill-Qwen-1.5B मॉडल को एक मध्य स्तर के GPU कार्ड पर तैनात किया जा सकता है। डेवलपर्स अपने व्यवसाय की जटिलता के आधार पर उपयुक्त मॉडल का परीक्षण करने के लिए चुन सकते हैं और API को कॉल करके इसे AI अनुप्रयोगों में शामिल कर सकते हैं।

Tencent Cloud TI प्लेटफॉर्म की यह नई पहल न केवल डेवलपर्स को शक्तिशाली AI टूल समर्थन प्रदान करती है, बल्कि बड़े मॉडल तकनीक के प्रसार और उपयोग को भी प्रभावी ढंग से बढ़ावा देती है। मुफ्त अनुभव और एक-क्लिक तैनाती सुविधाओं के माध्यम से, TI प्लेटफॉर्म ने डेवलपर्स के लिए बड़े मॉडल का उपयोग करने की बाधाओं को कम कर दिया है, जिससे वे AI तकनीक को वास्तविक व्यवसाय में तेजी से लागू कर सकें, और AI तकनीक की व्यावहारिकता और पहुंच को और बढ़ा सके।