A versão de ajuste fino de instruções Qwen-2-72B, da gigante chinesa de tecnologia Alibaba, conquistou o primeiro lugar no ranking mundial de modelos de linguagem grandes de código aberto.
De acordo com os dados de reavaliação da plataforma de código aberto mundialmente conhecida huggingface, o Qwen-2 superou o Llama-3 da Meta e o Mixtral da francesa Mistralai, demonstrando a liderança da China na área de modelos de linguagem grandes de código aberto.
Esta reavaliação do ranking teve como objetivo fornecer uma classificação mais objetiva, aumentando a dificuldade do processo de avaliação para revelar a verdadeira capacidade de cada modelo. Os dados mostram que o Qwen-2 ficou em primeiro lugar, a versão de ajuste fino Llama-3-70B em segundo e a versão de ajuste fino Mixtral-8x22B em quarto. Além disso, o modelo Phi-3-Medium-4K14B da Microsoft ficou em quinto lugar, demonstrando o potencial dos modelos com poucos parâmetros.
Vale mencionar que a versão Yi-1.5-34B-Chat da empresa chinesa Lingyi Wanwu ficou em sexto lugar, e o modelo Command R+104B de código aberto da Cohere ficou em sétimo. Em geral, os modelos de código aberto chineses ocupam quatro posições entre os dez primeiros do ranking, demonstrando uma forte competitividade.
Os resultados do ranking chamaram a atenção e geraram discussões entre os profissionais do setor. Alguns especialistas afirmam que a competitividade da China na área de modelos de linguagem grandes de código aberto já era evidente, e o desempenho do Qwen-2 é ainda mais impressionante. Em comparação com plataformas de modelos de linguagem grandes fechados internacionalmente famosas, o Qwen-2 também demonstrou uma capacidade considerável, sendo a única empresa chinesa a entrar no top 10 dos padrões de avaliação americanos.
Destaques:
⭐ A versão de ajuste fino de instruções Qwen-2-72B da Alibaba conquista o primeiro lugar no ranking mundial de modelos de linguagem grandes de código aberto.
⭐ Os modelos de código aberto chineses ocupam quatro posições entre os dez primeiros do ranking, consolidando sua posição de liderança.
⭐ O Qwen-2 demonstra uma forte competitividade em relação às plataformas de modelos de linguagem grandes fechados internacionalmente famosas.