A equipe Colossal-AI construiu um grande modelo de linguagem LLaMA-2 em chinês de baixo custo, obtendo excelentes resultados em vários rankings de avaliação. Eles disponibilizaram em código aberto todo o processo de treinamento, o código e os pesos, além de fornecerem a estrutura de avaliação ColossalEval. Essa solução pode ser usada para construir grandes modelos de linguagem em qualquer nicho, abrindo novas possibilidades para aplicações de IA.
LLaMA-2 versão chinesa de código aberto e comercializável: desempenho comparável a modelos de ponta!

GitHubDaily
Este artigo é do AIbase Daily
Bem-vindo à coluna [AI Daily]! Este é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias apresentamos os destaques da área de IA, com foco nos desenvolvedores, para o ajudar a obter insights sobre as tendências tecnológicas e a compreender as aplicações inovadoras de produtos de IA.