SuperCLUE 发布了中文大模型 8 月榜单,其中包括总排行榜、OPEN 多轮开放问题排行榜、OPT 三大能力客观题排行榜、十大基础能力排行榜和开源排行榜。评测选取了 16 个通用大语言模型,并使用了 3337 道全新的测试题。此次评测发现,国内大模型在中文任务上的表现与 GPT3.5 的差距在持续缩小。
SuperCLUE 发布了中文大模型 8 月榜单,其中包括总排行榜、OPEN 多轮开放问题排行榜、OPT 三大能力客观题排行榜、十大基础能力排行榜和开源排行榜。评测选取了 16 个通用大语言模型,并使用了 3337 道全新的测试题。此次评测发现,国内大模型在中文任务上的表现与 GPT3.5 的差距在持续缩小。