Modelo XVERSE-65B-2 de código aberto

A Yuanxiang anunciou o lançamento de código aberto do modelo de linguagem de grande porte de alto desempenho XVERSE-65B-2, versão base. Este modelo foi aprimorado especificamente para melhorar suas capacidades de código e matemática, mantendo as fortes habilidades de geração de conteúdo criativo, interpretação de papéis e uso de ferramentas da geração anterior.

Em avaliações abrangentes, o modelo superou o GPT-3.5 e o Llama2-70B, e ultrapassou todos os benchmarks de código aberto. No recente SuperCLUE, avaliação abrangente de modelos de linguagem de grande porte em chinês, o XVERSE-65B se destacou entre os modelos de código aberto domésticos.

A Yuanxiang já lançou três modelos de linguagem de grande porte de código aberto, sendo o XVERSE-65B o primeiro modelo de código aberto e de maior parâmetro disponível gratuitamente para uso comercial na China.