छोटा लेकिन शक्तिशाली! H2O.ai ने नया AI दृश्य मॉडल लॉन्च किया, दस्तावेज़ विश्लेषण क्षेत्र में टेक gigantes को मात दी

हाल ही में, H2O.ai ने दो नए दृश्य भाषा मॉडल लॉन्च करने की घोषणा की है, जो दस्तावेज़ विश्लेषण और ऑप्टिकल कैरेक्टर रिकग्निशन (OCR) कार्यों की दक्षता को बढ़ाने के लिए बनाए गए हैं। ये दो मॉडल H2OVL Mississippi-2B और H2OVL-Mississippi-0.8B हैं, जो प्रदर्शन में बड़े तकनीकी कंपनियों के मॉडलों की तुलना में उल्लेखनीय प्रतिस्पर्धा दिखाते हैं, और यह दस्तावेज़ भारी कार्य प्रवाह को संभालने वाले व्यवसायों के लिए अधिक प्रभावी समाधान प्रदान कर सकते हैं।

H2OVL Mississippi-0.8B मॉडल में केवल 8 करोड़ पैरामीटर हैं, फिर भी यह OCRBench टेक्स्ट पहचान कार्य में सभी अन्य मॉडलों को पार कर गया, जिसमें उन प्रतियोगियों के मॉडल भी शामिल हैं जिनमें अरबों पैरामीटर हैं। जबकि 20 अरब पैरामीटर वाला H2OVL Mississippi-2B मॉडल कई दृश्य भाषा बेंचमार्क परीक्षणों में अच्छा प्रदर्शन करता है।

H2O.ai के संस्थापक और सीईओ श्री अंबाती ने एक साक्षात्कार में कहा: "हमारा डिज़ाइन किया गया H2OVL Mississippi मॉडल एक उच्च प्रदर्शन और लागत प्रभावी समाधान बनने के लिए है, जो सभी उद्योगों को AI संचालित OCR, दृश्य समझ और दस्तावेज़ AI प्रदान करता है।"

उन्होंने जोर देकर कहा कि ये मॉडल विभिन्न वातावरणों में प्रभावी ढंग से काम कर सकते हैं, और विशिष्ट क्षेत्रों की आवश्यकताओं के अनुसार समायोजित किए जा सकते हैं, जिससे व्यवसायों को लागत कम करने के साथ-साथ दक्षता बढ़ाने में मदद मिलती है।

H2O.ai ने इन दोनों नए मॉडलों को Hugging Face प्लेटफ़ॉर्म पर मुफ्त में जारी किया है, जिससे डेवलपर्स और व्यवसाय अपने आवश्यकताओं के अनुसार मॉडलों को संशोधित और अनुकूलित कर सकते हैं। यह कदम न केवल H2O.ai के उपयोगकर्ता आधार को बढ़ाता है, बल्कि दस्तावेज़ AI समाधान अपनाने की इच्छा रखने वाले व्यवसायों के लिए अधिक विकल्प प्रदान करता है।

साथ ही, अंबाती ने यह भी बताया कि छोटे, विशेष मॉडल के आर्थिक लाभ को नजरअंदाज नहीं किया जा सकता। "हमारा जनरेटिव प्री-ट्रेंड ट्रांसफार्मर मॉडल ग्राहकों के साथ गहन सहयोग पर आधारित है, जिसका उद्देश्य व्यावसायिक दस्तावेज़ों से सार्थक जानकारी निकालना है।" उन्होंने बताया कि H2O.ai के मॉडल कम संसाधनों का उपयोग करते हुए प्रभावी दस्तावेज़ प्रसंस्करण क्षमता प्रदान करते हैं, विशेष रूप से जब गुणवत्ता खराब स्कैन, कठिनाई से पढ़े जाने वाले हस्तलेख या बड़े पैमाने पर संशोधित दस्तावेज़ों का सामना करते हैं।

मॉडल लिंक:

H2OVL-Mississippi-0.8B: https://huggingface.co/h2oai/h2ovl-mississippi-800m

H2OVL Mississippi-2B: https://huggingface.co/h2oai/h2ovl-mississippi-2b

मुख्य बिंदु:

🌟 H2O.ai ने नए दृश्य भाषा मॉडल H2OVL Mississippi-2B और H2OVL-Mississippi-0.8B लॉन्च किए, जो प्रभावी दस्तावेज़ विश्लेषण समाधान प्रदान करते हैं।

💡 H2OVL Mississippi-0.8B मॉडल टेक्स्ट पहचान कार्यों में बड़े प्रतियोगियों को पार करता है, जो छोटे मॉडलों की क्षमता को दर्शाता है।

📈 H2O.ai ओपन-सोर्स और व्यावहारिक AI समाधानों के प्रति प्रतिबद्ध है, जो व्यवसायों को डिजिटल परिवर्तन में मूल्यवान जानकारी निकालने में मदद करता है।

AI समाचार

छोटा लेकिन शक्तिशाली! H2O.ai ने नया AI दृश्य मॉडल लॉन्च किया, दस्तावेज़ विश्लेषण क्षेत्र में टेक gigantes को मात दी

AIbase基地

संबंधित AI समाचार अनुशंसाएँ

मिस्ट्रल AI ने सबसे शक्तिशाली दस्तावेज़ पहचान मॉडल मिस्ट्रल OCR लॉन्च किया: दस्तावेज़ समझ में क्रांति

विश्व का सबसे शक्तिशाली दावा! Mistral ने नया OCR API जारी किया, दस्तावेज़ों का व्यापक विश्लेषण

ओपन सोर्स OCR उपकरण olmOCR: कुशलतापूर्वक PDF को टेक्स्ट में बदलता है, तालिकाओं और हस्तलिखित पहचान का समर्थन करता है

गूगल DeepMind ने 100 बिलियन दृश्य भाषा डेटा सेट WebLI-100B लॉन्च किया