P-MMEval
बहुभाषी बहुकार्यी बेंचमार्क परीक्षण, बड़े भाषा मॉडल (LLM) के मूल्यांकन के लिए
सामान्य उत्पादअन्यबहुभाषीबेंचमार्क परीक्षण
P-MMEval एक बहुभाषी बेंचमार्क परीक्षण है जो बुनियादी और क्षमता-विशिष्ट डेटासेट को कवर करता है। यह मौजूदा बेंचमार्क परीक्षणों का विस्तार करता है, यह सुनिश्चित करता है कि सभी डेटासेट भाषा कवरेज में सुसंगत हैं, और कई भाषाओं में समानांतर नमूने प्रदान करता है, जिसमें 10 तक भाषाएँ शामिल हैं, जो 8 भाषा परिवारों को कवर करती हैं। P-MMEval बहुभाषी क्षमताओं का व्यापक मूल्यांकन करने और अंतर-भाषा स्थानांतरणीयता के तुलनात्मक विश्लेषण को करने में मदद करता है।
P-MMEval नवीनतम ट्रैफ़िक स्थिति
मासिक कुल विज़िट
2643001
बाउंस दर
33.58%
प्रति विज़िट औसत पृष्ठ
6.3
औसत विज़िट अवधि
00:05:41