Yandex推出的开源工具YaFSDP 突破LLM训练效率瓶颈

AIbase

发布于AI新闻资讯 · 1 分钟阅读 · 2024年6月12号 9:15

115

来自俄罗斯的科技巨头Yandex日前向全球AI社区开源了其自主研发的YaFSDP工具，这是业界目前最高效的大型语言模型(LLM)训练优化方法。与行业内广泛使用的FSDP技术相比，YaFSDP最高可将LLM训练速度提升26%，有望为AI开发者和企业节省大量GPU资源。

YaFSDP（Yandex Full Sharded Data Parallel）是Yandex在FSDP基础上的增强版本，专注于优化GPU通信效率和内存使用，消除了LLM训练过程中的瓶颈。在预训练、对齐和微调等通信密集型任务中，YaFSDP展现出卓越的性能提升，尤其在训练参数规模达到300亿至700亿时表现最为出色。

AI,人工智能，机器人，2024d9dc94358d8e

图源备注：图片由AI生成，图片授权服务商Midjourney

Yandex高级开发专家、YaFSDP团队成员Mikhail Khruschev表示:"YaFSDP最适合基于LLaMA架构的广泛使用开源模型。我们仍在持续优化，扩展其在不同模型架构和参数大小上的多功能性，以期在更广泛的场景中提升训练效率。"

据估算，以训练一个含700亿参数模型为例，采用YaFSDP可节省约150台GPU的资源，相当于每月节省50万至150万美元的算力成本。这一成本节约有望使自主LLM训练对中小企业和个人开发者更加可行。

与此同时，Yandex还承诺将继续为全球AI社区的发展贡献自身力量，YaFSDP开源即是贯彻这一承诺的体现。此前，该公司已对外分享过多个备受推崇的开源AI工具，如CatBoost高性能梯度提升库、AQLM极限模型压缩算法和Petals模型训练简化库等。

业内分析人士指出，随着LLM规模的不断扩大，训练效率的提升将成为人工智能发展的关键。YaFSDP等技术突破有望帮助AI社区更快地推进大模型研究，挖掘其在自然语言处理、计算机视觉等领域的应用前景。

AI音乐生成模型MusiConGen:用Transformer生成音乐，精确控制节奏和和弦

MusiConGen模型是在预训练的MusicGen-melody框架基础上进行微调的，主要用于生成各种风格的音乐片段。研究团队通过设置和弦和节奏的控制参数，展示了模型生成的音乐样本，涵盖了五种不同风格:休闲布鲁斯、平滑酸爵士、经典摇滚、高能放克以及重金属。

日本超市开始用AI技术监控员工微笑网友直呼大可不必

日本永旺超市利用AI系统"Smile-Kun"监控员工微笑，旨在通过量化员工的微笑及声音分析，提升服务技能。该系统要求员工通过特定方式打招呼，依据450个微表情点评分，满分为100分，并实时反馈，此外分析音量、流畅度和语气提供改进建议。员工反应显示微笑比例显著提升。然而，此举引发争议，部分网友批评做法过度量化员工个性情感，难以体现真诚服务。批评者认为基于上下级或同事评估更为合理。此做法虽旨在提高效率，但需考虑如何在追求效时兼顾员工感受与尊严，反思员工服务的真实性和人性化管理。

马斯克的xAI将于下月发布Grok 2，Grok 3预计12月推出

Elon Musk宣布xAI公司将于下月发布性能与GPT-4相当的AI模型Grok2，预计12月推出更强大的Grok3，该模型正在孟菲斯数据中心进行15000+GPU的大规模训练。虽仅部分特斯拉视频数据尚未应用于模型训练，但如ChatGPT对比显示Grok在某些方面仍见不足，밤收购语境下的追赶仍需时间。

小红书开首家“AI便利店” 为优秀AI笔记内容提供3W到50W流量扶持

小红书近日上线“科技薯”账号，启动全球首间AI便利店创业项目。通过与全网优质创作者和科技公司合作，提供AI前沿应用、干货、情感体验等内容，该便利店内售卖包括@赵纯想等人的创意AI产品，例如吃饭辅助、AI式泡面教程、AI颈椎病治疗、林亦LYi的祖传AI治疗、AI帮老妈完成未竟之事等。科技薯还开设活动，邀请笔记写手用 "#AI便利店" 发布AI相关笔记，可获得三万到五十万流量扶持、科技薯官方推荐和小米机器狗等惊喜奖励。此活动不仅整合AI内容，还通过激励机制催生更多AI创意内容。

AI新闻资讯

Yandex推出的开源工具YaFSDP 突破LLM训练效率瓶颈

AIbase

相关AI新闻推荐

​AI音乐生成模型MusiConGen:用Transformer生成音乐，精确控制节奏和和弦

日本超市开始用AI技术监控员工微笑 网友直呼大可不必

马斯克的xAI将于下月发布Grok 2，Grok 3预计12月推出

小红书开首家“AI便利店” 为优秀AI笔记内容提供3W到50W流量扶持

AI音乐生成模型MusiConGen:用Transformer生成音乐，精确控制节奏和和弦

日本超市开始用AI技术监控员工微笑网友直呼大可不必