DeepSeek ने Zhihu पर अपना आधिकारिक खाता खोला है और 《DeepSeek-V3/R1 अनुमान प्रणाली अवलोकन》 शीर्षक से एक तकनीकी लेख प्रकाशित किया है, जिसमें पहली बार इसके मॉडल अनुमान प्रणाली के अनुकूलन विवरण और लागत-लाभ अनुपात की जानकारी का विस्तृत खुलासा किया गया है, जिससे बहुप्रतीक्षित "DeepSeek ओपन सोर्स वीक" का आधिकारिक समापन होता है।

DeepSeek

लेख में DeepSeek-V3/R1 अनुमान प्रणाली के दो मुख्य अनुकूलन लक्ष्यों का वर्णन किया गया है: "उच्च थ्रूपुट, कम विलंबता"। इन लक्ष्यों को प्राप्त करने के लिए, DeepSeek ने बड़े पैमाने पर क्रॉस-नोड विशेषज्ञ समानांतर (EP) तकनीक का उपयोग किया है, हालाँकि इससे सिस्टम की जटिलता बढ़ गई है। लेख में मुख्य रूप से बताया गया है कि EP तकनीक का उपयोग बैच आकार बढ़ाने, ट्रांसमिशन समय को छिपाने और लोड संतुलन प्राप्त करने के लिए कैसे किया जाता है।

विशेष रूप से उल्लेखनीय यह है कि DeepSeek ने अपनी लागत और लाभ मार्जिन डेटा को सार्वजनिक किया है, जो दुर्लभ है। लेख में बताया गया है: "यदि GPU किराये की लागत $2 प्रति घंटे है, तो कुल लागत $87,072 प्रति दिन है। यदि सभी टोकन DeepSeek R1 की कीमत पर गणना किए जाते हैं, तो सैद्धांतिक रूप से एक दिन की कुल आय $562,027 होगी, जिससे लागत-लाभ अनुपात 545% होगा।"