2023年全球大语言模型竞赛中,中文大语言模型的表现备受瞩目。香港中文大学发布了CLEVA中文评测平台,包括全面的评测任务和指标。CLEVA注重各种指标,如准确性、鲁棒性、公平性、效率、校准、多样性等。同时,它提供多样的提示模板,确保评测公平性和模型性能分析。CLEVA还采用多种方法减轻数据污染风险,并提供易于操作的界面。