माइक्रोसॉफ्ट की पूरी चीनी टीम द्वारा विकसित WizardMath मॉडल एक 70B का ओपन-सोर्स बड़ा मॉडल है, जो AI द्वारा उत्पन्न निर्देशों का उपयोग करके बड़े मॉडल को फाइन-ट्यून करता है, जिससे इसकी गणितीय क्षमताएँ ChatGPT, Claude Instant 1, PaLM 2-540B जैसे कई बड़े मॉडलों से बेहतर हो जाती हैं। WizardMath मॉडल का ओपन-सोर्स कोड और पेपर GitHub पर प्रकाशित किया गया है, जिसे अकादमिक जगत और डेवलपर्स का व्यापक ध्यान मिला है। इस मॉडल की विधि Evil Instruction तकनीक का उपयोग करती है, जो विभिन्न कठिनाई स्तरों के ओपन-डोमेन निर्देशों को स्वचालित रूप से उत्पन्न करके बड़े मॉडल की प्रसंस्करण क्षमता को बढ़ाती है। लेखक ने इस विधि के आधार पर अन्य क्षेत्रों के मॉडल भी विकसित किए हैं, जैसे कि WizardCoder जो कोडिंग क्षमताओं पर केंद्रित है। इस शोध टीम में कई पूरी चीनी वैज्ञानिक शामिल हैं, जिनमें माइक्रोसॉफ्ट एशिया इंटरनेट इंजीनियरिंग इंस्टीट्यूट और Microsoft Research के शोधकर्ता शामिल हैं।
गणितीय क्षमता ChatGPT से अधिक, 70B ओपन-सोर्स बड़े मॉडल की धूम: AI द्वारा AI को ट्यून करना, माइक्रोसॉफ्ट का सभी चीनी टीम द्वारा उत्पादित
