BitNet
Un framework d'inférence pour les grands modèles de langage binaires (LLM)
Produit OrdinaireProgrammationGrands modèles de langageFramework d'inférence
BitNet est un framework d'inférence officiel développé par Microsoft, spécialement conçu pour les grands modèles de langage binaires (LLM). Il offre un cœur optimisé permettant une inférence rapide et sans perte de modèles à 1,58 bits sur CPU (la prise en charge de NPU et GPU est à venir). BitNet permet une amélioration de la vitesse de 1,37 à 5,07 fois sur les CPU ARM, avec une amélioration du rapport performance énergétique de 55,4 % à 70 %. Sur les CPU x86, l'amélioration de la vitesse varie de 2,37 à 6,17 fois, et le rapport performance énergétique de 71,9 % à 82,2 %. De plus, BitNet peut exécuter le modèle BitNet b1.58 de 100 milliards de paramètres sur un seul CPU, atteignant une vitesse d'inférence proche de la vitesse de lecture humaine, ouvrant ainsi de nouvelles possibilités pour l'exécution de grands modèles de langage sur des appareils locaux.
BitNet Dernière situation du trafic
Nombre total de visites mensuelles
474564576
Taux de rebond
36.20%
Nombre moyen de pages par visite
6.1
Durée moyenne de la visite
00:06:34