Phi-4-बहुविधा-निर्देश माइक्रोसॉफ्ट द्वारा विकसित एक बहुविधा आधार मॉडल है, जो पाठ, चित्र और ऑडियो इनपुट का समर्थन करता है और पाठ आउटपुट उत्पन्न करता है। यह मॉडल Phi-3.5 और Phi-4.0 के शोध और डेटासेट पर आधारित है, और निर्देश पालन क्षमता और सुरक्षा में सुधार के लिए पर्यवेक्षित ठीक-ठीक ट्यूनिंग, प्रत्यक्ष वरीयता अनुकूलन और मानव प्रतिक्रिया सुदृढीकरण शिक्षण प्रक्रियाओं से गुजरा है। यह कई भाषाओं के पाठ, चित्र और ऑडियो इनपुट का समर्थन करता है, जिसमें 128K का संदर्भ लंबाई है, और यह कई बहुविधा कार्यों जैसे आवाज पहचान, आवाज अनुवाद और दृश्य प्रश्नोत्तर के लिए उपयुक्त है। इस मॉडल ने बहुविधा क्षमताओं में उल्लेखनीय सुधार प्राप्त किया है, खासकर आवाज और दृश्य कार्यों में उत्कृष्ट प्रदर्शन किया है। यह डेवलपर्स को शक्तिशाली बहुविधा प्रसंस्करण क्षमता प्रदान करता है, जिसका उपयोग विभिन्न बहुविधा अनुप्रयोगों के निर्माण के लिए किया जा सकता है।