O P-MMEval é um benchmark multilíngue que abrange conjuntos de dados básicos e especializados em habilidades. Ele expande os benchmarks existentes, garantindo a consistência da cobertura de idiomas em todos os conjuntos de dados e fornecendo amostras paralelas em várias línguas, com suporte para até 10 idiomas, abrangendo 8 famílias de línguas. O P-MMEval auxilia na avaliação abrangente da capacidade multilíngue e na análise comparativa da transferibilidade entre idiomas.