Notícias e Informações de IA

Lista de Produtos de IA

Ranking de Agosto! Classificação mais recente do benchmark de modelos de linguagem grandes chineses SuperCLUE lançada

CLUE中文语言理解测评基准

Publicado emNotícias e Informações de IA · 1 minutos de leitura · Aug 29, 2023

193

A SuperCLUE publicou a classificação de agosto dos grandes modelos de linguagem chineses, incluindo a classificação geral, a classificação de perguntas abertas de várias rodadas OPEN, a classificação de questões objetivas de três habilidades OPT, a classificação das dez habilidades básicas e a classificação de código aberto. A avaliação selecionou 16 grandes modelos de linguagem de uso geral e utilizou 3.337 novas questões de teste. Esta avaliação descobriu que a diferença no desempenho dos grandes modelos domésticos em tarefas em chinês em comparação com o GPT-3.5 está diminuindo continuamente.

Modelo de linguagem grande chinês Benchmark de avaliação Ranking

Notícias de IA Relacionadas Recomendadas

Modelo de raciocínio de linguagem grande Ali Tongyi Qianwen QwQ-32B conquista o primeiro lugar no ranking da comunidade de código aberto global

Mar 7, 2025

16.1k

Ultrapassando o DeepSeek-R1! O modelo de linguagem grande Wanxiang da Alibaba assume a liderança no ranking global de código aberto

De acordo com o ranking mais recente divulgado pela comunidade de código aberto Hugging Face, o modelo de linguagem grande Wanxiang, lançado pela Alibaba, ultrapassou o DeepSeek-R1 apenas seis dias após seu lançamento em código aberto, assumindo a liderança em duas importantes listas de classificação: ranking de modelos populares e ranking de espaço de modelos. Essa conquista não apenas demonstra o desempenho técnico excepcional do modelo de linguagem grande Wanxiang, mas também reflete seu amplo reconhecimento e influência na comunidade global de código aberto.

Mar 3, 2025

15.9k

Modelo de geração de vídeo de código aberto Wan 2.1 da Alibaba lidera os rankings imediatamente após o lançamento; executa sem problemas em 4070

O modelo de geração de vídeo de código aberto Wan 2.1 da Alibaba alcançou o topo dos rankings assim que foi lançado. Sua performance é fluida, mesmo em GPUs RTX 4070.

Feb 27, 2025

15.8k

Tencent Yuanbao supera o Doubao e atinge o segundo lugar no ranking de aplicativos gratuitos da Apple na China, enquanto DeepSeek mantém a primeira posição

Feb 24, 2025

15.7k