IBM ने हाल ही में अपने नवीनतम ग्रैनाइट 3.2 बड़े भाषा मॉडल को जारी किया है, जिसका उद्देश्य उद्यमों और ओपन-सोर्स समुदाय को "छोटा, कुशल, व्यावहारिक" एंटरप्राइज़ AI समाधान प्रदान करना है। यह मॉडल न केवल बहु-मोडल और तर्क क्षमता रखता है, बल्कि लचीलेपन और लागत-प्रभावशीलता में भी सुधार करता है, जिससे उपयोगकर्ताओं के लिए इसे अपनाना आसान हो जाता है।

QQ_1741229530181.png

ग्रैनाइट 3.2 ने दस्तावेज़ों को संसाधित करने, डेटा वर्गीकरण और निष्कर्षण के लिए एक दृश्य भाषा मॉडल (VLM) पेश किया है। IBM का दावा है कि इस नए मॉडल ने कुछ महत्वपूर्ण बेंचमार्क परीक्षणों में, लामा 3.2 11B और पिक्सट्रल 12B जैसे बड़े मॉडलों को भी मात दी है। इसके अलावा, मानक गणितीय तर्क बेंचमार्क परीक्षणों में ग्रैनाइट 3.2 के 8B मॉडल ने बड़े मॉडलों के बराबर या उनसे बेहतर प्रदर्शन दिखाया है।

तर्क क्षमता में सुधार के लिए, ग्रैनाइट 3.2 के कुछ मॉडल में "थिंकिंग चेन" फ़ंक्शन भी है, जो मध्यवर्ती तर्क चरणों को स्पष्ट कर सकता है। इस फ़ंक्शन के लिए बड़ी कंप्यूटिंग शक्ति की आवश्यकता होती है, लेकिन उपयोगकर्ता दक्षता को अनुकूलित करने और समग्र लागत को कम करने के लिए आवश्यकतानुसार इसे सक्षम या अक्षम कर सकते हैं। IBM AI अनुसंधान के उपाध्यक्ष श्रीराम राघवन ने लॉन्च इवेंट में कहा कि अगली पीढ़ी के AI का ध्यान दक्षता, एकीकरण और वास्तविक प्रभाव पर है, जिससे उद्यम बिना अधिक खर्च किए शक्तिशाली परिणाम प्राप्त कर सकते हैं।

तर्क क्षमता में सुधार के अलावा, ग्रैनाइट 3.2 ने "ग्रैनाइट गार्डियन" सुरक्षा मॉडल का एक छोटा संस्करण भी पेश किया है, जिसका आकार 30% कम कर दिया गया है, लेकिन प्रदर्शन पिछली पीढ़ी के मॉडल के स्तर पर बना हुआ है। इसके अलावा, IBM ने "वर्णनीय विश्वास" नामक एक क्षमता भी पेश की है, जो जोखिमों का अधिक विस्तृत मूल्यांकन करने और सुरक्षा निगरानी में अनिश्चितताओं पर विचार करने में सक्षम है।

ग्रैनाइट 3.2 को IBM के ओपन-सोर्स डॉकिंग टूलकिट पर प्रशिक्षित किया गया है, जो डेवलपर्स को दस्तावेज़ों को कस्टम एंटरप्राइज़ AI मॉडल के लिए आवश्यक विशिष्ट डेटा में बदलने की अनुमति देता है। मॉडल प्रशिक्षण के दौरान 85 मिलियन पीडीएफ फ़ाइलों और 26 मिलियन सिंथेटिक प्रश्नोत्तर जोड़ियों को संसाधित किया गया था ताकि VLM की जटिल दस्तावेज़ वर्कफ़्लो को संभालने की क्षमता को बढ़ाया जा सके।

IBM ने अगली पीढ़ी के टाइनीटाइममिक्सर्स (TTM) मॉडल को भी लॉन्च करने की घोषणा की है, जो एक कॉम्पैक्ट प्री-ट्रेन्ड मॉडल है जो बहुभिन्नरूपी समय श्रृंखला पूर्वानुमान पर केंद्रित है और इसमें अधिकतम दो साल तक के दीर्घकालिक पूर्वानुमान की क्षमता है।

आधिकारिक ब्लॉग:https://www.ibm.com/new/announcements/ibm-granite-3-2-open-source-reasoning-and-vision

मुख्य बातें:  

📊 ग्रैनाइट 3.2 ने दृश्य भाषा मॉडल पेश किया है, जिससे दस्तावेज़ प्रसंस्करण और डेटा निष्कर्षण क्षमता में वृद्धि हुई है।  

💡 नए मॉडल में थिंकिंग चेन फ़ंक्शन है, जो तर्क प्रक्रिया को स्पष्ट कर सकता है और तर्क क्षमता को बढ़ा सकता है।  

🔍 ग्रैनाइट गार्डियन सुरक्षा मॉडल का आकार 30% कम कर दिया गया है, लेकिन प्रदर्शन अप्रभावित है, साथ ही वर्णनीय विश्वास जोखिम मूल्यांकन फ़ंक्शन भी पेश किया गया है।