27 फ़रवरी, 2025 को, टेनसेंट ने आधिकारिक तौर पर हुनयुआन न्यू जेनेरेशन फ़ास्ट थिंकिंग मॉडल टर्बो S जारी किया, जो प्रतिक्रिया की गति और प्रदर्शन अनुकूलन के मामले में बड़े मॉडल तकनीक में एक महत्वपूर्ण सफलता का प्रतीक है। डीपसीक R1 और हुनयुआन T1 जैसे पारंपरिक धीमी सोच वाले मॉडल के विपरीत, हुनयुआन टर्बो S "सेकंड में जवाब" प्राप्त कर सकता है, आउटपुट उत्तर की गति में काफी वृद्धि करता है, उच्चारण की गति दोगुनी हो जाती है, और पहले शब्द में देरी 44% कम हो जाती है। इस नवाचार ने मॉडल को ज्ञान, गणित और रचनात्मकता जैसे कई क्षेत्रों में उत्कृष्ट प्रदर्शन करने में सक्षम बनाया है, बड़े मॉडल की तेज प्रतिक्रिया क्षमता के लिए एक नया समाधान प्रदान करता है।

हुनयुआन टर्बो S का डिज़ाइन मानव दैनिक निर्णय लेने में 90%~95% अंतर्ज्ञान पर निर्भर करता है, जो तार्किक विश्लेषण के धीमी सोच वाले मॉडल के साथ मिलकर बड़े मॉडल को समस्या को हल करने की अधिक बुद्धिमान और कुशल क्षमता प्रदान करता है। लंबी और छोटी सोच श्रृंखला के संयोजन के माध्यम से, यह मॉडल न केवल मानविकी समस्याओं पर तेजी से अनुभव बनाए रखता है, बल्कि विज्ञान तर्क क्षमता में भी उल्लेखनीय सुधार करता है, जिससे समग्र प्रदर्शन में काफी वृद्धि होती है। उद्योग में कई सामान्य रूप से उपयोग किए जाने वाले सार्वजनिक बेंचमार्क परीक्षणों में, हुनयुआन टर्बो S ने डीपसीक V3, GPT4o और क्लाउड जैसे अग्रणी मॉडलों के बराबर प्रभाव दिखाया है।

微信截图_20250227173715.png

आर्किटेक्चर इनोवेशन के मामले में, हुनयुआन टर्बो S ने हाइब्रिड-माम्बा-ट्रांसफॉर्मर फ्यूजन मोड को अपनाया है, जो पारंपरिक ट्रांसफॉर्मर संरचना की गणना जटिलता और KV-कैश कैश उपयोग को प्रभावी ढंग से कम करता है, जिससे प्रशिक्षण और अनुमान लागत में उल्लेखनीय कमी आती है। इस मिश्रित आर्किटेक्चर ने पारंपरिक बड़े मॉडल में लंबे पाठ प्रशिक्षण और अनुमान की उच्च लागत की समस्या को तोड़ दिया है, माम्बा आर्किटेक्चर के लंबी श्रृंखलाओं को संसाधित करने के लाभ का उपयोग करते हुए, साथ ही जटिल संदर्भों को पकड़ने की ट्रांसफॉर्मर की क्षमता को भी बनाए रखा है, जो उद्योग में पहला मामला है जो माम्बा आर्किटेक्चर को बिना किसी नुकसान के अल्ट्रा-लार्ज MoE मॉडल में सफलतापूर्वक लागू करता है।

टेनसेंट हुनयुआन श्रृंखला के मुख्य आधार के रूप में, हुनयुआन टर्बो S भविष्य में अनुमान, लंबे पाठ और कोड जैसे व्युत्पन्न मॉडल के लिए बुनियादी क्षमताएं प्रदान करेगा। टर्बो S के आधार पर, टेनसेंट ने गहन सोच क्षमता वाला एक अनुमान मॉडल T1 भी लॉन्च किया है, जो पहले से ही टेनसेंट युआनबाओ में पूरी तरह से लॉन्च हो चुका है, और जल्द ही बाहरी API एक्सेस सेवा प्रदान करेगा।

वर्तमान में, डेवलपर्स और कॉर्पोरेट उपयोगकर्ता टेनसेंट क्लाउड की आधिकारिक वेबसाइट पर API कॉल के माध्यम से हुनयुआन टर्बो S का उपयोग कर सकते हैं और एक सप्ताह के मुफ्त परीक्षण का आनंद ले सकते हैं। इस मॉडल की कीमत 0.8 युआन/मिलियन टोकन इनपुट और 2 युआन/मिलियन टोकन आउटपुट है, जो पिछली पीढ़ी के हुनयुआन टर्बो मॉडल की तुलना में काफी कम है। इसके अलावा, हुनयुआन टर्बो S को धीरे-धीरे टेनसेंट युआनबाओ में लॉन्च किया जाएगा, और उपयोगकर्ता युआनबाओ में "हुनयुआन" मॉडल का चयन कर सकते हैं और गहन सोच फ़ंक्शन को बंद करके इसका अनुभव कर सकते हैं।

टेनसेंट हुनयुआन टर्बो मॉडल API मुफ्त परीक्षण आवेदन:https://cloud.tencent.com/apply/p/i2zophus2x8