zh
红薯智语
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
红薯智语
搜索全球AI产品动态
搜索全球AI信息,发现AI新机遇
新闻资讯
产品应用
变现案例
AI教程
类型 :
新闻资讯
产品应用
变现案例
AI教程
2024-08-09 16:26:57
.
AIbase
.
11.0k
手机跑大模型速度快5倍!微软亚研院开源新技术 CPU上也能享受极速体验
T-MAC(Table-Lookup-based MAC)技术旨在解决边缘设备部署大型语言模型(LLMs)的内存和计算限制问题。通过将模型权重量化为低比特表示,T-MAC利用查找表(LUT)替代传统乘法运算,显著提高了在CPU上的运行效率。这一方法大幅减少了运算所需内存,使数十亿参数的LLMs能够在资源受限的设备上高效运行,实现智能升级。与现有实现相比,T-MAC在吞吐量上提升4倍,能耗降低70%,即使在低端设备如Raspberry Pi 5上也能以接近成人阅读速度的速度生成令牌。T-MAC不仅适用于智能手机的实时语音识别和自然语言处理,还能提升智能家居设备的交互体验。作为开源项目,T-MAC有望推动边缘智能领域的发展,提供高效节能的LLM部署解决方案,为用户带来更丰富、便捷的智能体验。