XVERSE-7B: Modelo de IA de código aberto

A Yuanxiang anunciou o lançamento em código aberto do XVERSE-7B, um modelo de linguagem grande de 7 bilhões de parâmetros, incluindo sua versão base e uma versão para diálogo. Este é um modelo totalmente de código aberto, gratuito e comercializável.

Em comparação com o XVERSE-13B anterior, a versão 7B é mais compacta e pode ser executada em uma única placa gráfica de consumo. Após a quantização de inferência, requer apenas 6 GB de memória de vídeo, reduzindo significativamente a barreira de entrada e o custo de inferência.

O modelo apresentou excelente desempenho em vários testes de referência e possui fortes capacidades de cognição, planejamento, raciocínio e memória, com suporte para mais de 40 idiomas.