P-MMEval
Benchmark de avaliação multilíngue e multitarefa para modelos de linguagem grandes (LLMs)
Produto ComumOutrosMultilíngueBenchmark
O P-MMEval é um benchmark multilíngue que abrange conjuntos de dados básicos e especializados em habilidades. Ele expande os benchmarks existentes, garantindo a consistência da cobertura de idiomas em todos os conjuntos de dados e fornecendo amostras paralelas em várias línguas, com suporte para até 10 idiomas, abrangendo 8 famílias de línguas. O P-MMEval auxilia na avaliação abrangente da capacidade multilíngue e na análise comparativa da transferibilidade entre idiomas.
P-MMEval Situação do Tráfego Mais Recente
Total de Visitas Mensais
2643001
Taxa de Rejeição
33.58%
Média de Páginas por Visita
6.3
Duração Média da Visita
00:05:41