in
AI उत्पाद रैंकिंग
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
होम
AI समाचार
AI दैनिक
मुद्रीकरण गाइड
AI ट्यूटोरियल
AI उपकरण नेविगेशन
AI उत्पाद लाइब्रेरी
in
AI उत्पाद रैंकिंग
वैश्विक AI उत्पाद गतिशीलता खोजें
वैश्विक AI जानकारी खोजें, AI में नए अवसर खोजें
समाचार जानकारी
उत्पाद अनुप्रयोग
मुद्रीकरण मामले
AI ट्यूटोरियल
प्रकार :
समाचार जानकारी
उत्पाद अनुप्रयोग
मुद्रीकरण मामले
AI ट्यूटोरियल
2024-08-21 09:46:13
.
AIbase
.
11.2k
Llama3 का संकुचित संस्करण! Nvidia ने 4 करोड़ पैरामीटर के साथ Llama-3.1-Minitron4B नामक लघु भाषा मॉडल पेश किया
Nvidia के शोध दल ने मॉडल प्रूनिंग और डिस्टिलेशन तकनीकों का उपयोग करके Llama-3.1-Minitron4B को सफलतापूर्वक पेश किया, जो Llama3 मॉडल का संकुचित संस्करण है, जिसका उद्देश्य डिवाइस पर कृत्रिम बुद्धिमत्ता को सक्षम करना है। इस मॉडल ने गहरे प्रूनिंग और चौड़े प्रूनिंग तकनीकों के माध्यम से मूल 8B मॉडल के पैरामीटर की मात्रा को कम कर दिया है, जबकि बड़े मॉडलों के समान प्रदर्शन बनाए रखने में सक्षम रहा है। प्रशिक्षण डेटा की मात्रा में 40 गुना कमी के बावजूद, इस मॉडल ने MMLU मानक परीक्षण में 16% प्रदर्शन सुधार किया है। इस उपलब्धि को NVIDIA के द्वारा पेश किया गया है।
2024-07-25 11:34:33
.
AIbase
.
10.6k
NVIDIA ने Minitron छोटे भाषा मॉडल लॉन्च किए: प्रशिक्षण गति में 40 गुना वृद्धि
NVIDIA ने हाल ही में Minitron श्रृंखला के छोटे भाषा मॉडल लॉन्च किए, जिसमें 4B और 8B संस्करण शामिल हैं, जो प्रशिक्षण गति को 40 गुना बढ़ाते हैं और संसाधनों और डेटा की आवश्यकता को काफी कम करते हैं, जिससे लागत में बचत होती है। 'काटने' और 'ज्ञान आसवन' तकनीक के संयोजन के माध्यम से, Minitron मॉडल प्रदर्शन बनाए रखते हुए आकार को छोटा करता है, जिससे डेवलपर्स को कम लागत पर उन्नत तकनीक का उपयोग करके अनुवाद, भावना विश्लेषण और संवाद AI जैसे अनुप्रयोगों का लाभ उठाने की अनुमति मिलती है। Minitron मॉडल का ओपन-सोर्स होना और अधिक लोगों को इसे प्राप्त करने और उपयोग करने में आसानी प्रदान करता है।