新的Transformer加速技术FlashAttention-3发布成本直线下降

AIbase

发布于AI新闻资讯 · 1 分钟阅读 · 2024年7月12号 10:49

250

全新的Transformer加速技术FlashAttention-3震撼发布啦!这可不仅仅是个升级，它预示着咱们的大型语言模型（LLMs）的推理速度直线上升和成本的直线下降!

先说说这个FlashAttention-3，它和之前的版本比起来，简直是鸟枪换炮:

GPU利用率大提升:用FlashAttention-3训练和运行大型语言模型，速度直接翻倍，快了1.5到2倍，这效率，杠杠的!

低精度，高性能:它还能用低精度的数字（FP8）运行，同时保持准确性，这意味着啥?成本更低，性能却不打折!

处理长文本，小菜一碟:FlashAttention-3让AI模型处理长文本的能力大大增强，这在以前可是难以想象的。

FlashAttention是由Dao-AILab开发的开源库，它基于两篇重量级论文，为深度学习模型中的注意力机制提供了优化的实现。这个库特别适合处理大规模数据集和长序列，内存消耗和序列长度呈线性关系，远比传统的二次方关系高效。

技术亮点:

先进技术支持:局部注意力、确定性反向传播、ALiBi等，这些技术让模型的表达能力和灵活性更上一层楼。

Hopper GPU优化:FlashAttention-3特别优化了对Hopper GPU的支持，性能提升不止一星半点。

安装使用简单:支持CUDA11.6和PyTorch1.12以上版本，Linux系统下pip命令轻松安装，Windows用户虽然可能需要多测试，但绝对值得尝试。

核心功能:

高效性能:优化的算法大幅减少了计算和内存需求，尤其是长序列数据处理，性能提升肉眼可见。

内存优化:与传统方法相比，FlashAttention的内存消耗更低，线性关系让内存占用不再是问题。

先进特性:集成了多种先进技术，让模型性能和应用范围大幅提升。

易用性与兼容性:简单的安装和使用指南，加上对多种GPU架构的支持，让FlashAttention-3能够快速集成到各种项目中。

项目地址：https://github.com/Dao-AILab/flash-attention

AI音乐生成模型MusiConGen:用Transformer生成音乐，精确控制节奏和和弦

MusiConGen模型是在预训练的MusicGen-melody框架基础上进行微调的，主要用于生成各种风格的音乐片段。研究团队通过设置和弦和节奏的控制参数，展示了模型生成的音乐样本，涵盖了五种不同风格:休闲布鲁斯、平滑酸爵士、经典摇滚、高能放克以及重金属。

日本超市开始用AI技术监控员工微笑网友直呼大可不必

日本永旺超市利用AI系统"Smile-Kun"监控员工微笑，旨在通过量化员工的微笑及声音分析，提升服务技能。该系统要求员工通过特定方式打招呼，依据450个微表情点评分，满分为100分，并实时反馈，此外分析音量、流畅度和语气提供改进建议。员工反应显示微笑比例显著提升。然而，此举引发争议，部分网友批评做法过度量化员工个性情感，难以体现真诚服务。批评者认为基于上下级或同事评估更为合理。此做法虽旨在提高效率，但需考虑如何在追求效时兼顾员工感受与尊严，反思员工服务的真实性和人性化管理。

马斯克的xAI将于下月发布Grok 2，Grok 3预计12月推出

Elon Musk宣布xAI公司将于下月发布性能与GPT-4相当的AI模型Grok2，预计12月推出更强大的Grok3，该模型正在孟菲斯数据中心进行15000+GPU的大规模训练。虽仅部分特斯拉视频数据尚未应用于模型训练，但如ChatGPT对比显示Grok在某些方面仍见不足，밤收购语境下的追赶仍需时间。

小红书开首家“AI便利店” 为优秀AI笔记内容提供3W到50W流量扶持

小红书近日上线“科技薯”账号，启动全球首间AI便利店创业项目。通过与全网优质创作者和科技公司合作，提供AI前沿应用、干货、情感体验等内容，该便利店内售卖包括@赵纯想等人的创意AI产品，例如吃饭辅助、AI式泡面教程、AI颈椎病治疗、林亦LYi的祖传AI治疗、AI帮老妈完成未竟之事等。科技薯还开设活动，邀请笔记写手用 "#AI便利店" 发布AI相关笔记，可获得三万到五十万流量扶持、科技薯官方推荐和小米机器狗等惊喜奖励。此活动不仅整合AI内容，还通过激励机制催生更多AI创意内容。

AI新闻资讯

新的Transformer加速技术FlashAttention-3发布 成本直线下降

AIbase

相关AI新闻推荐

​AI音乐生成模型MusiConGen:用Transformer生成音乐，精确控制节奏和和弦

日本超市开始用AI技术监控员工微笑 网友直呼大可不必

马斯克的xAI将于下月发布Grok 2，Grok 3预计12月推出

小红书开首家“AI便利店” 为优秀AI笔记内容提供3W到50W流量扶持

新的Transformer加速技术FlashAttention-3发布成本直线下降

AI音乐生成模型MusiConGen:用Transformer生成音乐，精确控制节奏和和弦

日本超市开始用AI技术监控员工微笑网友直呼大可不必