OpenAI 重磅发布多语言 AI 数据集，推动全球语言平等

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年9月24号 10:26

335

近日，OpenAI 推出了一个重磅的多语言数据集，旨在评估人工智能在14种语言中的表现，包括阿拉伯语、德语、斯瓦希里语、孟加拉语和约鲁巴语。

这项名为 “多语言大规模多任务语言理解”（MMMLU）数据集，已在开放数据平台 Hugging Face 上发布，标志着 OpenAI 在全球 AI 领域的又一重要进展。

数据集入口:https://huggingface.co/datasets/openai/MMMLU

之前的 “大规模多任务语言理解”（MMLU）数据集仅针对英语进行评估，覆盖了数学、法律、计算机科学等57个学科。而新发布的 MMMLU 数据集则把目光放在了多种语言上，旨在填补 AI 研究中对低资源语言的关注空白。OpenAI 这次的举动，是为了满足企业和政府日益增长的需求，让 AI 系统能够更好地与全球用户进行互动。

为了确保数据集的高准确性，OpenAI 依赖专业的人类翻译来创建 MMMLU 数据集。这一点尤为重要，因为许多自动翻译工具在处理低资源语言时容易出现细微的错误，这在医疗、法律和金融等对精度要求极高的行业中可能带来严重后果。因此，OpenAI 通过人力翻译，确保数据集能够为多语言 AI 模型的评估提供可靠基础。

同时，OpenAI 还宣布推出 “OpenAI Academy”，该项目旨在支持开发者和有使命感的组织，尤其是在低收入和中等收入国家，利用 AI 技术解决当地问题。OpenAI 将提供培训、技术指导，以及100万美元的 API 使用积分，以帮助当地 AI 人才获取最新的资源。

对于企业而言，MMMLU 数据集为其在全球市场的 AI 系统评估提供了良好的机会。无论是客户服务、内容审核还是数据分析，能够在多种语言中表现出色的 AI 系统将有助于企业降低沟通障碍，提升用户体验。

随着更多公司和研究者开始利用这一多语言基准进行测试，未来 AI 系统的多语言能力将愈加重要。OpenAI 的这次数据集发布，不仅是对其在多语言 AI 领域的定位，也是对未来技术发展的积极推动。

划重点:
🌍 OpenAI 发布了 MMMLU 数据集，涵盖14种语言，推动多语言 AI 的研究和应用。
🧑‍🏫 数据集由专业人类翻译制作，确保高准确性，尤其适用于高要求的行业。
💡 OpenAI Academy推出，提供支持以促进低收入国家 AI 开发者的成长和发展。

德国音乐版权组织GEMA要求Suno AI 支付30%收入作为版权使用费

德国音乐版权组织GEMA高层近日就人工智能使用音乐版权问题发声，首席执行官Tobias Holzmüller博士呼吁AI市场应更加尊重创作者权利，监事会主席Ralf Weigand博士则建议建立新的法律框架，确保AI公司向版权方支付合理报酬。GEMA提议AI公司应支付其使用受版权保护材料净收入的30%。这一表态是继2024年11月GEMA起诉OpenAI ChatGPT使用受版权保护歌词之后的最新动态。与此同时，AI音乐创作平台Suno也面临来自GEMA和各大唱片公司的版权诉讼。面对诉讼，Suno联合创始人Mikey Shulman辩称批评者误解了其技术本

微软与 OpenAI 调整合作关系，开放竞争对手计算资源

在最新的公告中，微软与 OpenAI 宣布对双方的合作关系进行了重要调整。根据新的协议，OpenAI 将能够访问竞争对手的计算资源，打破了之前只依赖微软 Azure 云基础设施的限制。这一变化意味着 OpenAI 在未来的研发和模型训练中将有更多的灵活性。微软表示，新协议包括对新计算能力的排他性条款进行了修改，现已转为 “优先购买权” 模式。也就是说，微软在新增计算资源方面拥有优先权，但 OpenAI 仍然可以建立额外的计算能力，主要用于研究和训练新的 AI 模型。尽管合作关系的基础依然

微软独家地位生变:OpenAI获自由选择云服务供应商

微软与OpenAI的合作关系迎来重大转变。随着OpenAI宣布与软银、甲骨文等公司签署Stargate协议，微软不再是OpenAI的独家数据中心基础设施提供商。根据最新协议，微软获得对OpenAI新增云计算容量的"优先购买权"，这意味着当微软无法满足需求时，OpenAI可以寻求其他云服务提供商的支持。微软在博文中确认了这一变化，表示OpenAI已对Azure做出新的重要承诺，将继续支持其产品和培训需求。同时，微软也批准了OpenAI自主构建额外计算能力的权限，主要用于模型研究和训练。这一转变源于OpenAI面临的

5000亿美元投资！特朗普宣布OpenAI等科技巨头宣布合资成立“星际之门”项目

特朗普日前在白宫宣布了一项被称为 “史上最大 AI 基础设施项目” 的新计划，成立一个5000亿美元的合资企业，参与方包括 OpenAI、甲骨文公司（Oracle）和软银(SoftBank)。这个新合作项目名为 “星际之门”(Stargate)，旨在在美国建立一个数据中心和计算基础设施网络，以推动人工智能的发展。特朗普表示，该项目预计将 “几乎立即” 创造超过10万个美国就业机会。他指出，这一倡议不仅是对美国经济的信心表态，也是在与中国等国家竞争中寻求优势的战略举措。在宣布现场，特朗普与甲骨文