zh
AI产品榜
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
AI产品榜
搜索全球AI产品动态
搜索全球AI信息,发现AI新机遇
新闻资讯
产品应用
变现案例
AI教程
类型 :
新闻资讯
产品应用
变现案例
AI教程
2024-09-05 16:10:05
.
AIbase
.
11.6k
Llama3天瘦成Mamba!推理速度提升1.5倍
Mamba 团队的研究成果集中于将大型 Transformer 模型 Llama “蒸馏”为 Mamba,通过设计新型推理解码算法,显著提高了推理速度。研究目标旨在利用 Llama 的丰富知识,同时降低从零开始训练大型模型的高成本。研究团队结合了渐进式蒸馏、监督微调和定向偏好优化等方法,将 Zephyr-7B 和 Llama-38B 成功转换为线性 RNN 模型,性能与原始模型相当。关键创新在于为 Mamba 设计的全新算法,结合硬件特性实现基于 Mamba 的推测解码,实现速度与性能的双重提升。研究中,通过逐步替换注意力层、应用监督微调和用户偏好优化,以及引入推测解码算法,研究人员在保持模型性能的同时,实现了高达1.5倍的推理加速。整个过程在8卡80G A100上运行3到4天,展现了高效的训练效率。这项研究为未来模型的推理速度和性能提升提供了新思路。
2024-07-17 09:43:01
.
AIbase
.
10.3k
Mistral新模型Codestral Mamba 速度更快、文本处理长度是GPT-4o两倍
法国AI初创公司Mistral推出了名为Codestral Mamba的全新编码模型,其亮点在于处理速度快捷,能够高效处理超过256,000个token的长文本,显著优于市场同类产品。该模型基于高效Mamba架构,表现出色的编程性能,尤其适用本地编码项目。同时,Mistral还发布了Mathstral,专注数学推理和STEM领域应用,均提供开源许可,采纳了包括微软、IBM在内的投资。近期获得6.4亿美元融资,估值近60亿美元。此系列产品的推出,预示着Mistral在AI领域将取得重大突破。