腾讯 ने हाल ही में अपने स्वयं के विकसित स्टार ट्रेल नेटवर्क 2.0 संस्करण को जारी किया है, जो बड़े पैमाने पर कृत्रिम बुद्धिमत्ता मॉडल प्रशिक्षण के लिए महत्वपूर्ण प्रदर्शन सुधार लाता है। नए संस्करण ने नेटवर्क के आकार, हार्डवेयर प्रदर्शन, संचार प्रोटोकॉल और दोष निदान जैसे कई पहलुओं में महत्वपूर्ण प्रगति की है।

जानकारी के अनुसार, नेटवर्क के आकार के मामले में, स्टार ट्रेल नेटवर्क 2.0 एकल क्लस्टर में 100,000 कार्ड्स को नेटवर्क करने का समर्थन करता है, जो बड़े पैमाने पर AI प्रशिक्षण के लिए मजबूत बुनियादी ढाँचा प्रदान करता है। यह विस्तार भविष्य में बड़े पैमाने पर AI मॉडल प्रशिक्षण के लिए आधार तैयार करता है।

इंटरनेट बड़ा डेटा2

चित्र स्रोत नोट: चित्र AI द्वारा उत्पन्न, चित्र अधिकार सेवा प्रदाता Midjourney

हार्डवेयर अपग्रेड के मामले में, Tencent के स्वयं के विकसित स्विच की क्षमता 25.6T से बढ़कर 51.2T हो गई है, जिससे क्षमता में दो गुना वृद्धि हुई है। साथ ही, स्वनिर्मित सिलिकॉन ऑप्टिकल मॉड्यूल की गति 200G से 400G में अपग्रेड की गई है, जिससे गति में भी दो गुना वृद्धि हुई है। नए संस्करण में स्वनिर्मित कंप्यूटिंग नेटवर्क कार्ड भी शामिल है, जिससे संपूर्ण मशीन की संचार बैंडविड्थ 3.2T तक पहुँच गई है, जो उद्योग में अग्रणी स्तर पर है। ये हार्डवेयर अपग्रेड नेटवर्क प्रदर्शन में महत्वपूर्ण सुधार के लिए एक ठोस आधार प्रदान करते हैं।

संचार प्रोटोकॉल के मामले में, Tencent ने नया TiTa2.0 प्रोटोकॉल पेश किया है, जिसका तैनाती स्थान स्विच से नेटवर्क कार्ड पर स्थानांतरित किया गया है। साथ ही, भीड़भाड़ एल्गोरिदम को सक्रिय भीड़भाड़ नियंत्रण एल्गोरिदम में अपग्रेड किया गया है। ये अनुकूलन संचार दक्षता को 30% और बड़े मॉडल प्रशिक्षण की दक्षता को 10% बढ़ाते हैं।

इसके अतिरिक्त, Tencent ने नया उच्च प्रदर्शन समवर्ती संचार पुस्तकालय TCCL2.0 भी पेश किया है। यह पुस्तकालय NVLINK+NET विषमांतर संचार तकनीक का उपयोग करता है, जिससे डेटा का समांतर संचार संभव होता है। Auto-Tune Network Expert अनुकूलन एल्गोरिदम के साथ मिलकर, सिस्टम विभिन्न मशीन प्रकारों, नेटवर्क आकारों, मॉडल एल्गोरिदम आदि के आधार पर विभिन्न पैरामीटर को स्वचालित रूप से समायोजित कर सकता है। यह अपग्रेड संचार प्रदर्शन को 30% और बड़े मॉडल प्रशिक्षण की दक्षता को अतिरिक्त 10% बढ़ाता है।

यह ध्यान देने योग्य है कि TiTa और TCCL के अपग्रेड प्रभावों के संयोजन से, स्टार ट्रेल नेटवर्क की संचार दक्षता कुल 60% बढ़ गई है, जबकि बड़े मॉडल प्रशिक्षण की दक्षता में कुल 20% सुधार हुआ है। यह महत्वपूर्ण प्रदर्शन सुधार AI मॉडल के प्रशिक्षण प्रक्रिया को तेजी से बढ़ाने में मदद करेगा, शोधकर्ताओं और डेवलपर्स को अधिक प्रभावी कार्य वातावरण प्रदान करेगा।