Lors de la compétition mondiale des grands modèles linguistiques de 2023, les modèles linguistiques chinois ont attiré une attention considérable. L'Université chinoise de Hong Kong a publié CLEVA, une plateforme d'évaluation en chinois, incluant un ensemble complet de tâches et d'indicateurs d'évaluation.
CLEVA met l'accent sur divers indicateurs tels que la précision, la robustesse, l'équité, l'efficacité, la calibration et la diversité. Simultanément, elle fournit une variété de modèles de prompts pour garantir l'équité de l'évaluation et une analyse précise des performances des modèles.
CLEVA utilise également plusieurs méthodes pour atténuer les risques de contamination des données et offre une interface conviviale.