Desempenho de Modelos de Linguagem Grandes em Chinês em 2023

Na competição global de modelos de linguagem grandes de 2023, o desempenho dos modelos de linguagem grandes em chinês chamou muita atenção. A Universidade Chinesa de Hong Kong lançou a plataforma de avaliação em chinês CLEVA, que inclui tarefas e métricas abrangentes de avaliação.

A CLEVA enfatiza uma variedade de métricas, como precisão, robustez, imparcialidade, eficiência, calibração e diversidade. Ao mesmo tempo, ela fornece vários modelos de prompts para garantir a imparcialidade da avaliação e a análise do desempenho do modelo.

A CLEVA também emprega vários métodos para reduzir o risco de contaminação de dados e fornece uma interface fácil de usar.