M2RAG बहुविधा संदर्भ में पुनर्प्राप्ति-वर्धित पीढ़ी के लिए एक बेंचमार्क परीक्षण कोड भंडार है। यह बहुविधा दस्तावेज़ों को पुनर्प्राप्त करके प्रश्नों का उत्तर देता है, और बहुविधा बड़े भाषा मॉडल (MLLM) की बहुविधा संदर्भ ज्ञान का उपयोग करने की क्षमता का मूल्यांकन करता है। इस मॉडल का मूल्यांकन छवि विवरण, बहुविधा प्रश्नोत्तर, तथ्य सत्यापन और छवि पुनर्व्यवस्थापन जैसे कार्यों पर किया गया है, जिसका उद्देश्य बहुविधा संदर्भ सीखने में मॉडल की प्रभावशीलता को बढ़ाना है। M2RAG शोधकर्ताओं को एक मानकीकृत परीक्षण मंच प्रदान करता है, जो बहुविधा भाषा मॉडल के विकास को बढ़ावा देने में मदद करता है।