BitNet

Uma estrutura de inferência para modelos de linguagem grandes de 1-bit

Produto ComumProgramaçãoModelos de Linguagem GrandesEstrutura de Inferência
O BitNet é uma estrutura de inferência oficial desenvolvida pela Microsoft, projetada especificamente para modelos de linguagem grandes (LLMs) de 1-bit. Ele fornece um núcleo otimizado que suporta inferência de modelos de 1,58 bits rápida e sem perdas em CPUs (suporte a NPUs e GPUs em breve). O BitNet alcançou melhorias de velocidade de 1,37x a 5,07x em CPUs ARM e melhorias na eficiência energética de 55,4% a 70,0%. Em CPUs x86, as melhorias de velocidade variaram de 2,37x a 6,17x, com melhorias na eficiência energética de 71,9% a 82,2%. Além disso, o BitNet consegue executar o modelo BitNet b1.58 de 100B de parâmetros em uma única CPU, atingindo velocidades de inferência próximas à velocidade de leitura humana, expandindo as possibilidades de execução de LLMs em dispositivos locais.
Abrir Site

BitNet Situação do Tráfego Mais Recente

Total de Visitas Mensais

474564576

Taxa de Rejeição

36.20%

Média de Páginas por Visita

6.1

Duração Média da Visita

00:06:34

BitNet Tendência de Visitas

BitNet Distribuição Geográfica das Visitas

BitNet Fontes de Tráfego

BitNet Alternativas