A SuperCLUE publicou a classificação de agosto dos grandes modelos de linguagem chineses, incluindo a classificação geral, a classificação de perguntas abertas de várias rodadas OPEN, a classificação de questões objetivas de três habilidades OPT, a classificação das dez habilidades básicas e a classificação de código aberto. A avaliação selecionou 16 grandes modelos de linguagem de uso geral e utilizou 3.337 novas questões de teste. Esta avaliação descobriu que a diferença no desempenho dos grandes modelos domésticos em tarefas em chinês em comparação com o GPT-3.5 está diminuindo continuamente.