A SuperCLUE publicou a classificação de agosto dos grandes modelos de linguagem chineses, incluindo a classificação geral, a classificação de perguntas abertas de várias rodadas OPEN, a classificação de questões objetivas de três habilidades OPT, a classificação das dez habilidades básicas e a classificação de código aberto. A avaliação selecionou 16 grandes modelos de linguagem de uso geral e utilizou 3.337 novas questões de teste. Esta avaliação descobriu que a diferença no desempenho dos grandes modelos domésticos em tarefas em chinês em comparação com o GPT-3.5 está diminuindo continuamente.
Ranking de Agosto! Classificação mais recente do benchmark de modelos de linguagem grandes chineses SuperCLUE lançada

CLUE中文语言理解测评基准
Este artigo é do AIbase Daily
Bem-vindo à coluna [AI Daily]! Este é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias apresentamos os destaques da área de IA, com foco nos desenvolvedores, para o ajudar a obter insights sobre as tendências tecnológicas e a compreender as aplicações inovadoras de produtos de IA.