Meta AI为移动设备开发紧凑型语言模型MobileLLM 仅3.5亿参数

AIbase

发布于AI新闻资讯 · 1 分钟阅读 · 2024年7月9号 9:32

224

Meta AI 研究人员推出了 MobileLLM，这是一种为智能手机和其他资源受限的设备设计高效语言模型的新方法。这项研究于2024年6月27日发布，挑战了有关有效 AI 模型必要规模的假设。

该研究团队由 Meta Reality Labs、PyTorch 和 Meta AI Research （FAIR）的成员组成，专注于优化参数少于10亿的模型。这只是 GPT-4等模型的一小部分，据估计，GPT-4等模型的参数超过一万亿。

MobileLLM 的主要创新包括:

优先考虑模型深度而不是宽度
实现嵌入共享和分组查询注意
利用一种新颖的直接块权重共享技术

这些设计选择使得 MobileLLM 在常见基准测试任务上的表现比之前类似规模的模型高出2.7% 到4.3%。虽然这些个位数的改进似乎很小，但它们代表了竞争激烈的语言模型开发领域取得的重大进步。

值得注意的是，在某些 API 调用任务上，MobileLLM 的3.5亿参数版本表现出与更大的70亿参数 LLaMA-2模型相当的准确率。这表明，对于某些特定应用，更紧凑的模型可能会提供类似的功能，同时使用更少的计算资源。

MobileLLM 的开发与人们对更高效的 AI 模型日益增长的兴趣相吻合。随着超大型语言模型的进展出现放缓迹象，研究人员越来越多地探索更紧凑、更专业的设计的潜力。尽管名称中带有“LLM”，但对效率和设备部署的关注使 MobileLLM 与一些研究人员所说的小型语言模型（SLM）属于同一类别。

虽然 MobileLLM 尚未向公众开放，但 Meta 已将预训练代码开源，允许其他研究人员在其工作的基础上继续研究。随着这项技术的发展，它可能会为个人设备带来更先进的 AI 功能，尽管时间表和具体功能仍不确定。

AI音乐生成模型MusiConGen:用Transformer生成音乐，精确控制节奏和和弦

MusiConGen模型是在预训练的MusicGen-melody框架基础上进行微调的，主要用于生成各种风格的音乐片段。研究团队通过设置和弦和节奏的控制参数，展示了模型生成的音乐样本，涵盖了五种不同风格:休闲布鲁斯、平滑酸爵士、经典摇滚、高能放克以及重金属。

日本超市开始用AI技术监控员工微笑网友直呼大可不必

日本永旺超市利用AI系统"Smile-Kun"监控员工微笑，旨在通过量化员工的微笑及声音分析，提升服务技能。该系统要求员工通过特定方式打招呼，依据450个微表情点评分，满分为100分，并实时反馈，此外分析音量、流畅度和语气提供改进建议。员工反应显示微笑比例显著提升。然而，此举引发争议，部分网友批评做法过度量化员工个性情感，难以体现真诚服务。批评者认为基于上下级或同事评估更为合理。此做法虽旨在提高效率，但需考虑如何在追求效时兼顾员工感受与尊严，反思员工服务的真实性和人性化管理。

马斯克的xAI将于下月发布Grok 2，Grok 3预计12月推出

Elon Musk宣布xAI公司将于下月发布性能与GPT-4相当的AI模型Grok2，预计12月推出更强大的Grok3，该模型正在孟菲斯数据中心进行15000+GPU的大规模训练。虽仅部分特斯拉视频数据尚未应用于模型训练，但如ChatGPT对比显示Grok在某些方面仍见不足，밤收购语境下的追赶仍需时间。

小红书开首家“AI便利店” 为优秀AI笔记内容提供3W到50W流量扶持

小红书近日上线“科技薯”账号，启动全球首间AI便利店创业项目。通过与全网优质创作者和科技公司合作，提供AI前沿应用、干货、情感体验等内容，该便利店内售卖包括@赵纯想等人的创意AI产品，例如吃饭辅助、AI式泡面教程、AI颈椎病治疗、林亦LYi的祖传AI治疗、AI帮老妈完成未竟之事等。科技薯还开设活动，邀请笔记写手用 "#AI便利店" 发布AI相关笔记，可获得三万到五十万流量扶持、科技薯官方推荐和小米机器狗等惊喜奖励。此活动不仅整合AI内容，还通过激励机制催生更多AI创意内容。

AI新闻资讯

Meta AI为移动设备开发紧凑型语言模型MobileLLM 仅3.5亿参数

AIbase

相关AI新闻推荐

​AI音乐生成模型MusiConGen:用Transformer生成音乐，精确控制节奏和和弦

日本超市开始用AI技术监控员工微笑 网友直呼大可不必

马斯克的xAI将于下月发布Grok 2，Grok 3预计12月推出

小红书开首家“AI便利店” 为优秀AI笔记内容提供3W到50W流量扶持

AI音乐生成模型MusiConGen:用Transformer生成音乐，精确控制节奏和和弦

日本超市开始用AI技术监控员工微笑网友直呼大可不必