जिडोंग रिटेल तकनीकी टीम ने अपने पहले स्व-विकसित बिलियन-स्तरीय बिक्री पूर्वानुमान समय श्रृंखला बड़े मॉडल - TimeHF के सफल लॉन्च की घोषणा की है। यह मॉडल मानव प्रतिक्रिया आधारित प्रबलित अधिगम तकनीक (RLHF) पर आधारित है, पहली बार बिक्री पूर्वानुमान क्षेत्र में इसका उपयोग किया गया है, जिससे पूर्वानुमान की सटीकता में 10% से अधिक की वृद्धि हुई है, और मांग-पक्ष पूर्वानुमान की अनिश्चितता को काफी कम किया गया है। यह उपलब्धि न केवल जिडोंग के आंतरिक 20,000 उत्पादों के स्वचालित पुनःपूर्ति परिदृश्यों में उत्कृष्ट प्रदर्शन करती है, बल्कि कई सार्वजनिक डेटासेट पर भी उद्योग के मौजूदा स्तर को पार कर गई है, जो समय श्रृंखला पूर्वानुमान क्षेत्र में एक नया मानदंड बन गया है।
तकनीकी अन्वेषण में, जिडोंग आपूर्ति श्रृंखला एल्गोरिथम टीम ने पाया कि पारंपरिक समय श्रृंखला पूर्वानुमान विधियाँ, जैसे ARIMA, Prophet और प्रारंभिक गहन शिक्षण मॉडल LSTM, TCN आदि, जटिल पैटर्न पहचान और शून्य-शॉट सामान्यीकरण क्षमता के मामले में स्पष्ट कमियाँ रखती हैं। और मौजूदा समय श्रृंखला बड़े मॉडल डेटासेट गुणवत्ता और RLHF योजनाओं के साथ कई चुनौतियों का सामना करते हैं। इसके लिए, जिडोंग टीम ने डेटासेट निर्माण, मॉडल डिज़ाइन और प्रशिक्षण योजना के तीन पहलुओं में नवाचार किया है।
डेटासेट निर्माण के संदर्भ में, जिडोंग टीम ने जिडोंग के स्वयं के विपणन मात्रा समय श्रृंखला डेटा, सार्वजनिक डेटासेट और सिंथेटिक डेटा को एकीकृत किया है, गुणवत्ता फ़िल्टरिंग, डुप्लिकेट हटाने, विविधता रैंकिंग और डेटा मिलान जैसे तरीकों के माध्यम से, 1.5 बिलियन नमूनों वाला एक बड़े पैमाने पर उच्च-गुणवत्ता वाला जटिल डेटासेट बनाया गया है। समय श्रृंखला क्षेत्र में इस डेटासेट का पैमाना और गुणवत्ता अभूतपूर्व है, जो मॉडल प्रशिक्षण के लिए एक ठोस आधार प्रदान करता है।
मॉडल डिज़ाइन के संदर्भ में, जिडोंग ने PCTLM (Patch Convolutional Timeseries Large Model) मॉडल प्रस्तावित किया है। यह मॉडल पैच-आधारित विधि का उपयोग करता है, समय श्रृंखला को मॉडल करने के लिए मास्क किए गए एन्कोडर आर्किटेक्चर का उपयोग करता है, और समय स्थिति एन्कोडिंग के साथ समूहीकृत ध्यान तंत्र को पेश करता है, जो पैच के बीच जानकारी को प्रभावी ढंग से कैप्चर करता है और जटिल स्थानिक-तात्कालिक संबंधों को समझने की मॉडल की क्षमता में सुधार करता है।
प्रशिक्षण योजना के संदर्भ में, जिडोंग ने पहली बार शुद्ध समय श्रृंखला बड़े मॉडल के लिए उपयुक्त प्रबलित अधिगम ढाँचा TPO (Timeseries Policy Optimization) प्रस्तावित किया है। यह ढाँचा समय श्रृंखला बड़े मॉडल की विशेषताओं के अनुरूप है, समय श्रृंखला परिदृश्यों में पारंपरिक RLHF ढाँचे के प्रत्यक्ष अनुप्रयोग की समस्या को हल करता है, पूर्वानुमान संभाव्यता घटक, लाभ फ़ंक्शन डिज़ाइन और समय श्रृंखला हानि जैसे नवीन तरीकों को जोड़कर, मॉडल के पूर्वानुमान प्रदर्शन में उल्लेखनीय रूप से सुधार करता है।
कई नवाचारों के बाद, TimeHF ने कई सार्वजनिक डेटासेट पर SOTA (State of the Art) परिणाम प्राप्त किए हैं, वर्तमान अग्रणी समय श्रृंखला गहन शिक्षण विधियों और ठीक-ठीक बड़े मॉडल की तुलना में, यह मजबूत शून्य-शॉट प्रदर्शन और पूर्वानुमान सटीकता प्रदर्शित करता है। वर्तमान में, यह मॉडल जिडोंग आपूर्ति श्रृंखला प्रणाली में तैनात है और 20,000 SKU के लिए स्वचालित पुनःपूर्ति पूर्वानुमान प्रदान करता है, जिससे पूर्वानुमान सटीकता में उल्लेखनीय वृद्धि हुई है।
जिडोंग रिटेल ग्रुप आपूर्ति श्रृंखला टीम 19 अप्रैल को एक ऑनलाइन साझाकरण सत्र आयोजित करेगी, जिसमें TimeHF के तकनीकी विवरणों की विस्तृत व्याख्या की जाएगी, जिसमें उच्च-गुणवत्ता, विविध बड़े पैमाने पर समय श्रृंखला डेटासेट का निर्माण और समय श्रृंखला बड़े मॉडल के लिए RLHF योजना शामिल है। यह उपलब्धि न केवल जिडोंग के अपने आपूर्ति श्रृंखला प्रबंधन में क्रांति लाती है, बल्कि पूरे उद्योग के लिए मूल्यवान तकनीकी संदर्भ और व्यावहारिक उदाहरण भी प्रदान करती है।