हाल ही में, H2O.ai ने दो नए दृश्य भाषा मॉडल लॉन्च करने की घोषणा की है, जो दस्तावेज़ विश्लेषण और ऑप्टिकल कैरेक्टर रिकग्निशन (OCR) कार्यों की दक्षता को बढ़ाने के लिए बनाए गए हैं। ये दो मॉडल H2OVL Mississippi-2B और H2OVL-Mississippi-0.8B हैं, जो प्रदर्शन में बड़े तकनीकी कंपनियों के मॉडलों की तुलना में उल्लेखनीय प्रतिस्पर्धा दिखाते हैं, और यह दस्तावेज़ भारी कार्य प्रवाह को संभालने वाले व्यवसायों के लिए अधिक प्रभावी समाधान प्रदान कर सकते हैं।

H2OVL Mississippi-0.8B मॉडल में केवल 8 करोड़ पैरामीटर हैं, फिर भी यह OCRBench टेक्स्ट पहचान कार्य में सभी अन्य मॉडलों को पार कर गया, जिसमें उन प्रतियोगियों के मॉडल भी शामिल हैं जिनमें अरबों पैरामीटर हैं। जबकि 20 अरब पैरामीटर वाला H2OVL Mississippi-2B मॉडल कई दृश्य भाषा बेंचमार्क परीक्षणों में अच्छा प्रदर्शन करता है।

image.png

H2O.ai के संस्थापक और सीईओ श्री अंबाती ने एक साक्षात्कार में कहा: "हमारा डिज़ाइन किया गया H2OVL Mississippi मॉडल एक उच्च प्रदर्शन और लागत प्रभावी समाधान बनने के लिए है, जो सभी उद्योगों को AI संचालित OCR, दृश्य समझ और दस्तावेज़ AI प्रदान करता है।"  

image.png

उन्होंने जोर देकर कहा कि ये मॉडल विभिन्न वातावरणों में प्रभावी ढंग से काम कर सकते हैं, और विशिष्ट क्षेत्रों की आवश्यकताओं के अनुसार समायोजित किए जा सकते हैं, जिससे व्यवसायों को लागत कम करने के साथ-साथ दक्षता बढ़ाने में मदद मिलती है।

H2O.ai ने इन दोनों नए मॉडलों को Hugging Face प्लेटफ़ॉर्म पर मुफ्त में जारी किया है, जिससे डेवलपर्स और व्यवसाय अपने आवश्यकताओं के अनुसार मॉडलों को संशोधित और अनुकूलित कर सकते हैं। यह कदम न केवल H2O.ai के उपयोगकर्ता आधार को बढ़ाता है, बल्कि दस्तावेज़ AI समाधान अपनाने की इच्छा रखने वाले व्यवसायों के लिए अधिक विकल्प प्रदान करता है।

साथ ही, अंबाती ने यह भी बताया कि छोटे, विशेष मॉडल के आर्थिक लाभ को नजरअंदाज नहीं किया जा सकता। "हमारा जनरेटिव प्री-ट्रेंड ट्रांसफार्मर मॉडल ग्राहकों के साथ गहन सहयोग पर आधारित है, जिसका उद्देश्य व्यावसायिक दस्तावेज़ों से सार्थक जानकारी निकालना है।" उन्होंने बताया कि H2O.ai के मॉडल कम संसाधनों का उपयोग करते हुए प्रभावी दस्तावेज़ प्रसंस्करण क्षमता प्रदान करते हैं, विशेष रूप से जब गुणवत्ता खराब स्कैन, कठिनाई से पढ़े जाने वाले हस्तलेख या बड़े पैमाने पर संशोधित दस्तावेज़ों का सामना करते हैं।

मॉडल लिंक:

H2OVL-Mississippi-0.8B: https://huggingface.co/h2oai/h2ovl-mississippi-800m

H2OVL Mississippi-2B: https://huggingface.co/h2oai/h2ovl-mississippi-2b

मुख्य बिंदु:  

🌟 H2O.ai ने नए दृश्य भाषा मॉडल H2OVL Mississippi-2B और H2OVL-Mississippi-0.8B लॉन्च किए, जो प्रभावी दस्तावेज़ विश्लेषण समाधान प्रदान करते हैं।  

💡 H2OVL Mississippi-0.8B मॉडल टेक्स्ट पहचान कार्यों में बड़े प्रतियोगियों को पार करता है, जो छोटे मॉडलों की क्षमता को दर्शाता है।  

📈 H2O.ai ओपन-सोर्स और व्यावहारिक AI समाधानों के प्रति प्रतिबद्ध है, जो व्यवसायों को डिजिटल परिवर्तन में मूल्यवान जानकारी निकालने में मदद करता है।