BitNet
Uma estrutura de inferência para modelos de linguagem grandes de 1-bit
Produto ComumProgramaçãoModelos de Linguagem GrandesEstrutura de Inferência
O BitNet é uma estrutura de inferência oficial desenvolvida pela Microsoft, projetada especificamente para modelos de linguagem grandes (LLMs) de 1-bit. Ele fornece um núcleo otimizado que suporta inferência de modelos de 1,58 bits rápida e sem perdas em CPUs (suporte a NPUs e GPUs em breve). O BitNet alcançou melhorias de velocidade de 1,37x a 5,07x em CPUs ARM e melhorias na eficiência energética de 55,4% a 70,0%. Em CPUs x86, as melhorias de velocidade variaram de 2,37x a 6,17x, com melhorias na eficiência energética de 71,9% a 82,2%. Além disso, o BitNet consegue executar o modelo BitNet b1.58 de 100B de parâmetros em uma única CPU, atingindo velocidades de inferência próximas à velocidade de leitura humana, expandindo as possibilidades de execução de LLMs em dispositivos locais.
BitNet Situação do Tráfego Mais Recente
Total de Visitas Mensais
474564576
Taxa de Rejeição
36.20%
Média de Páginas por Visita
6.1
Duração Média da Visita
00:06:34