माइक्रोसॉफ्ट ने तीन नए Phi-3.5 मॉडल जारी करने की घोषणा की है, जो बहुभाषी और बहु-आकृति कृत्रिम बुद्धिमत्ता के विकास में इसके नेतृत्व की स्थिति को और मजबूत करते हैं। ये तीन नए मॉडल हैं: Phi-3.5-mini-instruct, Phi-3.5-MoE-instruct और Phi-3.5-vision-instruct, जो विभिन्न अनुप्रयोग परिदृश्यों के लिए हैं।
Phi-3.5Mini Instruct मॉडल एक हल्का AI मॉडल है, जिसमें 3.8 करोड़ पैरामीटर हैं, जो सीमित गणना क्षमता वाले वातावरण के लिए बहुत उपयुक्त है। यह 128k के संदर्भ लंबाई का समर्थन करता है और विशेष रूप से निर्देश निष्पादन क्षमता के लिए अनुकूलित है, जो कोड उत्पन्न करने, गणितीय समस्याओं को हल करने और तार्किक तर्क जैसे कार्यों के लिए उपयुक्त है। आकार में छोटा होने के बावजूद, इस मॉडल ने बहुभाषी और बहु-चरण संवाद कार्यों में उल्लेखनीय प्रतिस्पर्धा दिखाई है, जो समान अन्य मॉडलों को पीछे छोड़ देता है।
लिंक: https://huggingface.co/microsoft/Phi-3.5-mini-instruct
Phi-3.5MoE मॉडल, यह एक "विशेषज्ञ मिश्रण" मॉडल है, जिसमें विभिन्न प्रकार के मॉडल का संयोजन है, प्रत्येक विशिष्ट कार्य पर ध्यान केंद्रित करता है। इसमें 41.9 अरब पैरामीटर हैं, 128k के संदर्भ लंबाई का समर्थन करता है और विभिन्न तर्क कार्यों में मजबूत प्रदर्शन दिखा सकता है। यह मॉडल कोड, गणित और बहुभाषी समझ में उत्कृष्ट प्रदर्शन करता है, और कुछ बेंचमार्क परीक्षणों में बड़े मॉडल जैसे OpenAI के GPT-4o mini को भी पीछे छोड़ देता है।
लिंक: https://huggingface.co/microsoft/Phi-3.5-MoE-instruct
Phi-3.5Vision Instruct मॉडल एक उन्नत बहु-आकृति AI मॉडल है, जिसमें पाठ और चित्र प्रसंस्करण क्षमता का समावेश है, जो चित्र समझ, ऑप्टिकल कैरेक्टर पहचान, चार्ट और तालिका विश्लेषण, और वीडियो सारांश जैसे कार्यों के लिए उपयुक्त है। यह मॉडल भी 128k के संदर्भ लंबाई का समर्थन करता है, जो जटिल बहु-फ्रेम दृश्य कार्यों को संभाल सकता है।
लिंक: https://huggingface.co/microsoft/Phi-3.5-vision-instruct
इन तीन मॉडलों को प्रशिक्षित करने के लिए, माइक्रोसॉफ्ट ने बड़े पैमाने पर डेटा प्रोसेसिंग की। Mini Instruct मॉडल ने 3.4 ट्रिलियन टोकन का उपयोग किया, 512 H100-80G GPU पर 10 दिनों तक प्रशिक्षित किया गया; Vision Instruct मॉडल ने 500 अरब टोकन का उपयोग किया, 6 दिनों की प्रशिक्षण अवधि के बाद; जबकि MoE मॉडल ने 23 दिनों में 4.9 ट्रिलियन टोकन का उपयोग किया।
यह उल्लेखनीय है कि ये तीनों Phi-3.5 मॉडल MIT ओपन-सोर्स लाइसेंस के तहत जारी किए गए हैं, जिससे डेवलपर्स इन सॉफ़्टवेयरों का स्वतंत्र रूप से उपयोग, संशोधन और वितरण कर सकते हैं। यह न केवल माइक्रोसॉफ्ट के ओपन-सोर्स समुदाय के प्रति समर्थन को दर्शाता है, बल्कि अधिक डेवलपर्स को अपने अनुप्रयोगों में अत्याधुनिक AI क्षमताओं को एकीकृत करने की अनुमति देता है।
मुख्य बिंदु:
🌟 माइक्रोसॉफ्ट ने तीन नए AI मॉडल लॉन्च किए हैं, जो हल्के तर्क, मिश्रित विशेषज्ञ और बहु-आकृति कार्यों के लिए हैं।
📊 Phi-3.5MoE ने बेंचमार्क परीक्षणों में GPT-4o mini को पीछे छोड़ दिया, उत्कृष्ट प्रदर्शन किया।
📜 तीनों मॉडल MIT ओपन-सोर्स लाइसेंस के तहत हैं, डेवलपर्स स्वतंत्र रूप से उपयोग और संशोधन कर सकते हैं।