P-MMEval
Benchmark de evaluación multilingüe y multitarea para modelos lingüísticos grandes (LLM)
Producto ComúnOtrosMultilingüeBenchmark
P-MMEval es un benchmark multilingüe que abarca conjuntos de datos básicos y especializados en capacidades. Amplía los benchmarks existentes, asegurando la coherencia en la cobertura lingüística de todos los conjuntos de datos y ofreciendo muestras paralelas en múltiples idiomas, con soporte para hasta 10 idiomas pertenecientes a 8 familias lingüísticas. P-MMEval ayuda a evaluar exhaustivamente las capacidades multilingües y a realizar análisis comparativos de la transferibilidad entre idiomas.
P-MMEval Situación del tráfico más reciente
Total de visitas mensuales
2643001
Tasa de rebote
33.58%
Páginas promedio por visita
6.3
Duración promedio de la visita
00:05:41