हाल ही में एक प्रेस कॉन्फ्रेंस में, अली इंटरनेशनल AI टीम ने अपने नवीनतम विकसित बहु-मोडल बड़े मॉडल Ovis का अनावरण किया, यह अभिनव AI तकनीक निश्चित रूप से विभिन्न उद्योगों के लिए नए अवसर लाती है। Ovis में शक्तिशाली छवि समझने और डेटा प्रोसेसिंग क्षमताएँ हैं, जो ताजगी प्रदान करती हैं।

Ovis की बहु-मोडल क्षमता अत्यधिक मजबूत है, यह टेक्स्ट, इमेज और अन्य प्रकार के डेटा को प्रोसेस कर सकती है, उत्कृष्ट समग्र क्षमता प्रदर्शित करती है। पारंपरिक बड़े भाषा मॉडल की तुलना में, Ovis न केवल टेक्स्ट को समझ सकता है, बल्कि छवियों जैसे गैर-टेक्स्ट जानकारी का गहराई से विश्लेषण भी कर सकता है।

उदाहरण के लिए, उपयोगकर्ता को केवल एक व्यंजन की फोटो अपलोड करनी होती है, Ovis तुरंत पहचान कर विस्तृत खाना बनाने की प्रक्रिया प्रदान कर सकता है, जिससे उपयोगकर्ता आसानी से स्वादिष्ट व्यंजन बना सकता है।

छवि

Ovis द्वारा चित्र की पहचान करने पर व्यंजन विधि प्रदान की जा सकती है

बहु-मोडल मूल्यांकन प्लेटफार्म OpenCompass के डेटा के अनुसार, Ovis1.6-Gemma2-9B ने 30B पैरामीटर से कम के मॉडलों में समग्र रैंकिंग में पहला स्थान प्राप्त किया, MiniCPM-V-2.6 जैसे कई उत्कृष्ट मॉडलों को पीछे छोड़ दिया। यह उपलब्धि Ovis की बाजार में प्रतिस्पर्धात्मकता को साबित करती है।

छवि

Ovis के OpenCompass पर मूल्यांकन डेटा की स्थिति

इसके अलावा, Ovis गणितीय तर्क, वस्तु पहचान और जटिल निर्णय लेने के क्षेत्रों में उत्कृष्ट प्रदर्शन करता है। उदाहरण के लिए, यह गणित की समस्याओं का सटीक उत्तर दे सकता है, फूलों की प्रजातियों की पहचान कर सकता है, और यहां तक कि हस्तलिखित पाठ का अनुवाद भी कर सकता है। Ovis के पांच मुख्य लाभों में, सबसे ध्यान आकर्षित करने वाला इसका अभिनव आर्किटेक्चर डिज़ाइन और उच्च-रिज़ॉल्यूशन छवि प्रोसेसिंग क्षमता है, जिससे यह बहु-मोडल कार्यों में प्रदर्शन में काफी सुधार करता है।

Ovis की ओपन-सोर्स नीति भी प्रशंसा का पात्र है। इसका लाइसेंस Apache2.0 प्रोटोकॉल को अपनाता है, जिसका अर्थ है कि उपयोगकर्ता इस मॉडल का स्वतंत्र रूप से उपयोग और सुधार कर सकते हैं। Ovis श्रृंखला के मॉडल और कोड GitHub पर ओपन-सोर्स कर दिए गए हैं, जिससे डेवलपर्स आसानी से एक्सेस कर सकते हैं और द्वितीयक विकास कर सकते हैं।

स्वायत्त ड्राइविंग, चिकित्सा निदान, वीडियो सामग्री समझने जैसे व्यापक अनुप्रयोगों में, बहु-मोडल बड़े मॉडल Ovis ने विशाल संभावनाएं दिखाई हैं। अली इंटरनेशनल टीम ने खुलासा किया कि पिछले छह महीनों के डेटा से पता चलता है कि व्यापारियों की AI की मांग लगातार बढ़ रही है, हर दो महीने में उपयोग की मात्रा दोगुनी हो रही है, Ovis निश्चित रूप से अधिक व्यापारियों को संचालन दक्षता बढ़ाने में मदद करेगा।

मुख्य बिंदु:

1️⃣ Ovis एक बहु-मोडल बड़ा मॉडल है, जो टेक्स्ट और इमेज जैसे विभिन्न डेटा प्रकारों को प्रोसेस कर सकता है, उत्कृष्ट समग्र क्षमताएं प्रदर्शित करता है।

2️⃣ Ovis1.6-Gemma2-9B ने OpenCompass मूल्यांकन में 30B पैरामीटर से कम मॉडलों में समग्र रैंकिंग में पहला स्थान प्राप्त किया, कई उत्कृष्ट प्रतिस्पर्धियों को पीछे छोड़ दिया।

3️⃣ Ovis Apache2.0 ओपन-सोर्स प्रोटोकॉल को अपनाता है, सभी मॉडल और कोड GitHub पर सार्वजनिक किए गए हैं, डेवलपर्स स्वतंत्र रूप से उपयोग और सुधार कर सकते हैं।