ज़ीरोंबेंच
ज़ीरोंबेंच आधुनिक बड़े बहुविध मॉडल के लिए एक उच्च कठिनाई वाला दृश्य बेंचमार्क है।
सामान्य उत्पादछविबहुविधबेंचमार्क
ज़ीरोंबेंच एक बेंचमार्क है जो बड़े बहुविध मॉडल (LMMs) की दृश्य समझ क्षमता का मूल्यांकन करने के लिए डिज़ाइन किया गया है। यह 100 सावधानीपूर्वक डिज़ाइन किए गए और कड़ाई से समीक्षा किए गए जटिल प्रश्नों और 334 उप-प्रश्नों के माध्यम से वर्तमान मॉडल की सीमाओं को चुनौती देता है। इस बेंचमार्क का उद्देश्य मौजूदा दृश्य बेंचमार्क की कमियों को दूर करना और अधिक चुनौतीपूर्ण और उच्च-गुणवत्ता वाले मूल्यांकन उपकरण प्रदान करना है। ज़ीरोंबेंच का मुख्य लाभ इसकी उच्च कठिनाई, हल्कापन, विविधता और उच्च गुणवत्ता है, जिससे यह मॉडल के प्रदर्शन को प्रभावी ढंग से अलग कर सकता है। इसके अलावा, यह विस्तृत उप-प्रश्न मूल्यांकन प्रदान करता है, जिससे शोधकर्ताओं को मॉडल की तर्क क्षमता को बेहतर ढंग से समझने में मदद मिलती है।