बाइटडांस ने पीकिंग यूनिवर्सिटी के साथ मिलकर MegaScale बनाया: LLM को प्रशिक्षण देने के लिए एकल "10,000 कार्ड क्लस्टर"

开源中国

द्वारा प्रकाशितAI समाचार · 1 मिनट पढ़ें · Feb 29, 2024

517

बाइटडांस ने बीजिंग विश्वविद्यालय की अनुसंधान टीम के साथ मिलकर arXiv पर एक पत्र प्रकाशित किया, जिसमें उन्होंने बड़े भाषा मॉडल को प्रशिक्षित करने के लिए अपने उत्पादन प्रणाली MegaScale का परिचय दिया। MegaScale ने 10,000 से अधिक GPU के एकल क्लस्टर का निर्माण किया, जिससे 55.2% मॉडल FLOP उपयोगिता प्राप्त हुई। इस प्रणाली में सिस्टम घटकों और घटनाओं की निगरानी के लिए एक नैदानिक उपकरणों का सेट भी शामिल है, जो मूल कारणों का पता लगाने, दोष सहिष्णुता और विलंबता समस्याओं को हल करने में मदद करता है।

पोर्टकी एआई गेटवे: विभिन्न बड़े भाषा मॉडल को आसानी से एकीकृत करने वाला ओपन-सोर्स एआई समाधान

पोर्टकी एआई गेटवे एक ओपन-सोर्स समाधान है जो विभिन्न बड़े भाषा मॉडल को एक साथ जोड़ने में आसानी प्रदान करता है। यह डेवलपर्स को विभिन्न मॉडलों की क्षमताओं का उपयोग करने और एकीकृत अनुभव बनाने में मदद करता है।

अलीबाबा का नया ओपन-सोर्स अनुमान बड़ा मॉडल QwQ-32B, DeepSeek-R1 के बराबर प्रदर्शन, कम मेमोरी की आवश्यकता

अलीबाबा ने हाल ही में अपना नया ओपन-सोर्स अनुमान बड़ा भाषा मॉडल QwQ-32B जारी किया है, जो DeepSeek-R1 के बराबर प्रदर्शन प्रदान करता है लेकिन कम मेमोरी की आवश्यकता के साथ। यह उन डेवलपर्स के लिए एक उत्कृष्ट विकल्प है जो उच्च-प्रदर्शन वाले अनुमान मॉडल की तलाश में हैं लेकिन सीमित संसाधनों के साथ काम कर रहे हैं।

AI समाचार

बाइटडांस ने पीकिंग यूनिवर्सिटी के साथ मिलकर MegaScale बनाया: LLM को प्रशिक्षण देने के लिए एकल "10,000 कार्ड क्लस्टर"

开源中国

संबंधित AI समाचार अनुशंसाएँ

फायरक्रॉल ने LLM.txt API लॉन्च किया: किसी भी वेबसाइट का LLM.txt उत्पन्न करने के लिए केवल URL प्रदान करें

बिना प्रशिक्षण के! Q-फ़िल्टर KV कैशे के कुशल संपीड़न और अनुमान प्रदर्शन को बढ़ाते हैं

पोर्टकी एआई गेटवे: विभिन्न बड़े भाषा मॉडल को आसानी से एकीकृत करने वाला ओपन-सोर्स एआई समाधान

अलीबाबा का नया ओपन-सोर्स अनुमान बड़ा मॉडल QwQ-32B, DeepSeek-R1 के बराबर प्रदर्शन, कम मेमोरी की आवश्यकता