苹果AI发布7亿参数开源语言模型DCLM 准确率提高、计算资源占用降低

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年7月22号 9:34

393

最近，苹果公司的人工智能团队和华盛顿大学等多家机构合作，推出一款名叫 DCLM的开源语言模型。这款模型的参数达7亿，并且在训练过程中使用了多达2.5万亿个数据令牌，帮助我们更好地理解和生成语言。

那么，什么是语言模型呢?简单来说，它是一种可以分析和生成语言的程序，能够帮助我们完成各种任务，比如翻译、文本生成和情感分析。为了让这些模型表现得更好，我们需要优质的数据集。然而，获取和整理这些数据并不是一件容易的事，因为我们需要过滤掉无关的或有害的内容，并去除重复的信息。

为了应对这个挑战，苹果的研究团队推出了 “数据集竞争”（DataComp for Language Models，简称 DCLM），这是一种用于语言模型的数据集优化工具。他们最近在 Hugging Face 平台上开源了 DCIM 模型和数据集。开源版本包括DCLM-7B、DCLM-1B、dclm-7b-it、DCLM-7B-8k、dclm-baseline-1.0和dclm -baseline-1.0-parquet，，研究人员可以通过这个平台进行大量实验，找到最有效的数据整理策略。

https://huggingface.co/collections/mlfoundations/dclm-669938432ef5162d0d0bc14b

DCLM 的核心优势在于它的结构化工作流程。研究人员可以根据需要选择不同规模的模型，从4.12亿到7亿参数不等，同时还可以试验不同的数据整理方法，比如去重和过滤。通过这些系统化的实验，研究人员可以清晰地评估不同数据集的质量。这不仅为未来的研究奠定了基础，也帮助我们理解如何通过改善数据集来提升模型的表现。

例如，利用 DCLM 建立的基准数据集，研究团队训练了一个7亿参数的语言模型，竟然在 MMLU 基准测试中取得了64% 的5-shot 准确率!这相较于之前的最高水平提高了6.6个百分点，并且使用的计算资源减少了40%。DCLM 基线模型的表现也与 Mistral-7B-v0.3和 Llama38B 相当，而后两者需要的计算资源要多得多。

DCLM 的推出为语言模型的研究提供了一个新的标杆，帮助科学家们系统化地提升模型的性能，同时降低了所需的计算资源。

划重点:
1️⃣ 苹果 AI 与多家机构合作推出 DCLM，创造了一个强大的开源语言模型。
2️⃣ DCLM 提供标准化的数据集优化工具，帮助研究人员进行有效实验。
3️⃣ 新模型在重要测试中取得了显著进展，同时降低了计算资源的需求。

AI音乐生成模型MusiConGen:用Transformer生成音乐，精确控制节奏和和弦

MusiConGen模型是在预训练的MusicGen-melody框架基础上进行微调的，主要用于生成各种风格的音乐片段。研究团队通过设置和弦和节奏的控制参数，展示了模型生成的音乐样本，涵盖了五种不同风格:休闲布鲁斯、平滑酸爵士、经典摇滚、高能放克以及重金属。

日本超市开始用AI技术监控员工微笑网友直呼大可不必

日本永旺超市利用AI系统"Smile-Kun"监控员工微笑，旨在通过量化员工的微笑及声音分析，提升服务技能。该系统要求员工通过特定方式打招呼，依据450个微表情点评分，满分为100分，并实时反馈，此外分析音量、流畅度和语气提供改进建议。员工反应显示微笑比例显著提升。然而，此举引发争议，部分网友批评做法过度量化员工个性情感，难以体现真诚服务。批评者认为基于上下级或同事评估更为合理。此做法虽旨在提高效率，但需考虑如何在追求效时兼顾员工感受与尊严，反思员工服务的真实性和人性化管理。

马斯克的xAI将于下月发布Grok 2，Grok 3预计12月推出

Elon Musk宣布xAI公司将于下月发布性能与GPT-4相当的AI模型Grok2，预计12月推出更强大的Grok3，该模型正在孟菲斯数据中心进行15000+GPU的大规模训练。虽仅部分特斯拉视频数据尚未应用于模型训练，但如ChatGPT对比显示Grok在某些方面仍见不足，밤收购语境下的追赶仍需时间。

小红书开首家“AI便利店” 为优秀AI笔记内容提供3W到50W流量扶持

小红书近日上线“科技薯”账号，启动全球首间AI便利店创业项目。通过与全网优质创作者和科技公司合作，提供AI前沿应用、干货、情感体验等内容，该便利店内售卖包括@赵纯想等人的创意AI产品，例如吃饭辅助、AI式泡面教程、AI颈椎病治疗、林亦LYi的祖传AI治疗、AI帮老妈完成未竟之事等。科技薯还开设活动，邀请笔记写手用 "#AI便利店" 发布AI相关笔记，可获得三万到五十万流量扶持、科技薯官方推荐和小米机器狗等惊喜奖励。此活动不仅整合AI内容，还通过激励机制催生更多AI创意内容。

AI新闻资讯

苹果AI发布7亿参数开源语言模型DCLM 准确率提高、计算资源占用降低

AIbase基地

相关AI新闻推荐

​AI音乐生成模型MusiConGen:用Transformer生成音乐，精确控制节奏和和弦

日本超市开始用AI技术监控员工微笑 网友直呼大可不必

马斯克的xAI将于下月发布Grok 2，Grok 3预计12月推出

小红书开首家“AI便利店” 为优秀AI笔记内容提供3W到50W流量扶持

AI音乐生成模型MusiConGen:用Transformer生成音乐，精确控制节奏和和弦

日本超市开始用AI技术监控员工微笑网友直呼大可不必