A análise de artigo examina a “bagunça de pontuação” nos sistemas atuais de avaliação de modelos grandes, afirmando que as classificações de modelos grandes apresentam amplamente o cenário de “todos são os primeiros”. Os conjuntos de dados de pontuação abertos existentes podem levar ao fenômeno de “trapaça”; enquanto os conjuntos de dados privados fechados afetam a imparcialidade. Além disso, as dimensões de avaliação de algumas classificações não são científicas e abrangentes o suficiente. O artigo sugere a construção de um sistema de avaliação autoritário, ferramentas e processos de avaliação abertos para garantir a imparcialidade, mas os conjuntos de dados de avaliação devem adotar o modelo de “histórico aberto + formal fechado”. Além disso, a comercialização de modelos grandes é muito mais importante do que os parâmetros do modelo e a classificação nas classificações.
A "Batalha dos Cem Modelos": Todos são os primeiros? Quando acabará a "gabarito" dos grandes modelos?

罗超频道
Este artigo é do AIbase Daily
Bem-vindo à coluna [AI Daily]! Este é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias apresentamos os destaques da área de IA, com foco nos desenvolvedores, para o ajudar a obter insights sobre as tendências tecnológicas e a compreender as aplicações inovadoras de produtos de IA.