हाल ही में, आर्टिफिशियल इंटेलिजेंस रिसर्च कंपनी Epoch AI ने एक इंटरएक्टिव सिम्युलेटर लॉन्च किया है, जो बड़े भाषा मॉडल को प्रशिक्षित करने के लिए आवश्यक कंप्यूटिंग पावर का अनुकरण करने के लिए विशेष रूप से डिज़ाइन किया गया है। इस सिम्युलेटर के माध्यम से, शोधकर्ताओं ने पाया कि हालांकि 2012 के पुराने ग्राफिक्स कार्ड (जैसे GTX580) का उपयोग करके GPT-4 को प्रशिक्षित किया जा सकता है, लेकिन इसकी लागत आज के आधुनिक हार्डवेयर की तुलना में दस गुना होगी।

image.png

Epoch AI के शोध से पता चलता है कि GPT-4 को प्रशिक्षित करने के लिए आवश्यक फ्लोटिंग पॉइंट ऑपरेशंस की संख्या (FLOP) 1e25 से 1e26 के बीच है। इस शोध के लिए, सिम्युलेटर ने विभिन्न ग्राफिक्स कार्ड की दक्षता का विश्लेषण किया, विशेष रूप से मॉडल के आकार में वृद्धि के दौरान उनके प्रदर्शन का। परिणाम बताते हैं कि जैसे-जैसे मॉडल का आकार बढ़ता है, दक्षता आमतौर पर कम होती जाती है। हाल के वर्षों में लॉन्च किए गए H100 ग्राफिक्स कार्ड का उदाहरण लेते हुए, यह लंबे समय तक उच्च दक्षता बनाए रख सकता है, जबकि V100 ग्राफिक्स कार्ड बड़े प्रशिक्षण आकार का सामना करते समय दक्षता में अधिक स्पष्ट गिरावट दिखाता है।

Epoch AI के प्रयोग में, GTX580 ग्राफिक्स कार्ड की मेमोरी केवल 3GB थी। यह ग्राफिक्स कार्ड 2012 में AlexNet मॉडल को प्रशिक्षित करने के लिए एक प्रमुख विकल्प था। हालांकि तकनीक में प्रगति हुई है, शोधकर्ताओं का मानना है कि पुराने हार्डवेयर का उपयोग करके इतनी बड़ी मात्रा में प्रशिक्षण करना संभव है, लेकिन इसके लिए आवश्यक संसाधन और लागत बहुत अधिक हैं।

इसके अलावा, यह सिम्युलेटर कई डेटा केंद्रों के बीच जटिल प्रशिक्षण अनुकरण का समर्थन करता है। उपयोगकर्ता डेटा केंद्र के आकार, विलंबता और कनेक्शन बैंडविड्थ जैसे पैरामीटर को कस्टमाइज़ कर सकते हैं, ताकि कई स्थानों पर प्रशिक्षण संचालन का अनुकरण किया जा सके। यह उपकरण आधुनिक ग्राफिक्स कार्ड (जैसे H100 और A100) के बीच प्रदर्शन के अंतर का विश्लेषण करने, विभिन्न बैच आकारों और मल्टी-GPU प्रशिक्षण के प्रभावों का अध्ययन करने की अनुमति भी देता है, और मॉडल के आउटपुट को रिकॉर्ड करने के लिए विस्तृत लॉग फ़ाइलें उत्पन्न करता है।

Epoch AI का कहना है कि इस सिम्युलेटर को विकसित करने का उद्देश्य हार्डवेयर दक्षता में सुधार की समझ को गहरा करना और चिप निर्यात नियंत्रण के प्रभाव का आकलन करना है। इस सदी में बड़े प्रशिक्षण कार्यों की अपेक्षित वृद्धि के साथ, भविष्य की हार्डवेयर आवश्यकताओं को समझना विशेष रूप से महत्वपूर्ण हो गया है।

मुख्य बिंदु:  

💻 2021 में लॉन्च किया गया GTX580 ग्राफिक्स कार्ड दस गुना लागत पर GPT-4 को प्रशिक्षित कर सकता है, लेकिन इसकी दक्षता कम है।  

📊 सिम्युलेटर विभिन्न GPU के प्रदर्शन के अंतर का विश्लेषण कर सकता है और मल्टी डेटा सेंटर प्रशिक्षण अनुकरण का समर्थन करता है।  

🔍 यह अध्ययन भविष्य की हार्डवेयर आवश्यकताओं की समझ को बढ़ाने और बड़े AI मॉडल के प्रशिक्षण में मदद करने के लिए है।