माइक्रोसॉफ्ट ने घोषणा की है कि उसके Phi श्रृंखला के जनरेटिव AI मॉडल में एक नया सदस्य जुड़ गया है - Phi-4। पिछले संस्करणों की तुलना में, Phi-4 कई पहलुओं में सुधार लाया है, विशेष रूप से गणितीय समस्याओं को हल करने की क्षमता में, जो उच्च गुणवत्ता वाले प्रशिक्षण डेटा के कारण संभव हुआ है।

गुरुवार रात तक, Phi-4 की पहुंच अपेक्षाकृत सीमित है, यह केवल माइक्रोसॉफ्ट के नवीनतम Azure AI Foundry विकास प्लेटफॉर्म पर उपलब्ध है, और यह केवल माइक्रोसॉफ्ट अनुसंधान लाइसेंस अनुबंध के तहत अनुसंधान के उपयोग के लिए सीमित है।

कृत्रिम बुद्धिमत्ता मस्तिष्क, बड़े मॉडल

छवि स्रोत नोट: छवि AI द्वारा उत्पन्न की गई है, छवि अधिकार सेवा प्रदाता Midjourney

Phi-4 माइक्रोसॉफ्ट द्वारा पेश किया गया नवीनतम छोटे भाषा मॉडल है, जिसमें 14 बिलियन पैरामीटर हैं। यह अन्य छोटे मॉडलों जैसे GPT-4o mini, Gemini2.0Flash और Claude3.5Haiku के समान है, जो आमतौर पर तेजी से चलने और कम लागत के साथ होते हैं, जबकि पिछले कुछ वर्षों में छोटे भाषा मॉडलों के प्रदर्शन में लगातार सुधार हो रहा है।

माइक्रोसॉफ्ट Phi-4 के प्रदर्शन में सुधार का श्रेय "उच्च गुणवत्ता वाले संश्लेषित डेटा सेट" और मानव-निर्मित सामग्री के उच्च गुणवत्ता वाले डेटा सेट के उपयोग को देता है, और इसके बाद की अनियोजित प्रशिक्षण सुधारों को लागू किया गया है।

आज, कई कृत्रिम बुद्धिमत्ता प्रयोगशालाएँ मॉडल के प्रदर्शन में सुधार के लिए संश्लेषित डेटा और बाद के प्रशिक्षण की संभावनाओं पर ध्यान केंद्रित कर रही हैं। Scale AI के सीईओ Alexandr Wang ने गुरुवार को एक ट्वीट में कहा: "हम पहले से ही प्रशिक्षण पूर्व डेटा की बाधा तक पहुँच चुके हैं।" यह कथन हाल की रिपोर्टों की पुष्टि करता है।

इसके अलावा, यह ध्यान देने योग्य है कि Phi-4 माइक्रोसॉफ्ट के AI उपाध्यक्ष Sébastien Bubeck के इस्तीफे के बाद पेश किया गया पहला Phi श्रृंखला मॉडल है। Bubeck ने माइक्रोसॉफ्ट के AI क्षेत्र में महत्वपूर्ण भूमिका निभाई है और Phi मॉडल विकास में एक प्रमुख व्यक्ति रहे हैं। Bubeck ने अक्टूबर में माइक्रोसॉफ्ट छोड़ा और OpenAI में शामिल हो गए।