ताओ तियान समूह ने एआई चेंग टेक्नोलॉजी के साथ मिलकर मेगाट्रॉन-एलएलएएमए नामक बड़े मॉडल प्रशिक्षण ढांचे को ओपन-सोर्स किया है, जिसका उद्देश्य बड़े भाषा मॉडल के प्रशिक्षण प्रदर्शन को बढ़ाना, प्रशिक्षण लागत को कम करना और एलएलएएमए समुदाय के साथ संगतता बनाए रखना है। यह ढांचा 32 कार्ड प्रशिक्षण पर 176% की तेजी हासिल कर सकता है और नेटवर्क की अस्थिरता के प्रति उच्च सहिष्णुता दिखाता है। मेगाट्रॉन-एलएलएएमए अनुकूलनात्मक सर्वोत्तम कॉन्फ़िगरेशन चयन, मॉडल संरचना में परिवर्तन के समर्थन और विभिन्न हार्डवेयर वातावरण में उत्कृष्ट प्रदर्शन प्रशिक्षण समाधान पर ध्यान केंद्रित करेगा।
TaoTian Group联合AiCheng科技开源大模型训练框架Megatron-LLaMA

机器之心
यह लेख AIbase दैनिक से है
【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।