P-MMEval

Benchmark de evaluación multilingüe y multitarea para modelos lingüísticos grandes (LLM)

Producto ComúnOtrosMultilingüeBenchmark
P-MMEval es un benchmark multilingüe que abarca conjuntos de datos básicos y especializados en capacidades. Amplía los benchmarks existentes, asegurando la coherencia en la cobertura lingüística de todos los conjuntos de datos y ofreciendo muestras paralelas en múltiples idiomas, con soporte para hasta 10 idiomas pertenecientes a 8 familias lingüísticas. P-MMEval ayuda a evaluar exhaustivamente las capacidades multilingües y a realizar análisis comparativos de la transferibilidad entre idiomas.
Abrir sitio web

P-MMEval Situación del tráfico más reciente

Total de visitas mensuales

2643001

Tasa de rebote

33.58%

Páginas promedio por visita

6.3

Duración promedio de la visita

00:05:41

P-MMEval Tendencia de visitas

P-MMEval Distribución geográfica de las visitas

P-MMEval Fuentes de tráfico

P-MMEval Alternativas