OSI发布开源AI新标准：需披露训练数据，Meta Llama是伪开源？

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年10月29号 9:13

122

最近，开放源代码倡议组织（OSI）发布了一项新定义，明确什么才算是真正的 “开源” 人工智能。这一新标准引起了科技巨头们的关注，尤其是 Meta 的 Llama 模型，因为它并不符合这些规则。OSI 一直是开放源代码软件的行业标准制定者，但在 AI 系统中，有一些传统许可证未能覆盖的元素，比如模型训练数据。

根据 OSI 的新定义，任何被认为是真正开放源代码的 AI 系统必须提供三样东西:首先是有关训练 AI 所用数据的详细信息，以便他人能够理解并重现这些结果;其次是用于构建和运行 AI 的完整代码;最后，还需要提供训练中的设置和权重，这些对 AI 的结果产生影响。

大模型代码互联网

图源备注：图片由AI生成，图片授权服务商Midjourney

这一规定直接挑战了 Meta 的 Llama 模型。尽管 Llama 可以公开下载和使用，但它在商业用途上有一定的限制，并且没有提供训练数据，因此未能满足 OSI 对于开放的标准。Meta 的发言人 Faith Eischen 表示，他们与 OSI 在许多方面是有共识的，但对于这个定义存在不同意见。她指出，定义 “开放源代码 AI” 并不容易，因为传统的定义未能涵盖当今快速发展的 AI 模型的复杂性。

OSI 的执行董事 Stefano Maffulli 表示，他们花了两年的时间，与全球的专家共同制定这一标准。他们与学术界、机器学习和自然语言处理领域的专家进行了深入交流，也与内容创作者合作，力求做到全面。

Meta 限制训练数据访问的理由主要是出于安全考虑，但批评者则认为其背后可能是为了降低法律责任和保护竞争优势。许多 AI 模型的训练数据中几乎肯定包含了版权材料。现在，针对 Meta、OpenAI 等公司的诉讼层出不穷，原告们只能依靠间接证据来证明他们的作品被抓取。

同时，Maffulli 认为当前的情况与过去相似。他回忆起1990年代微软对待开源的态度，认为 Meta 正在以相似的理由将其技术封锁。对他们而言，训练数据就是 “秘密武器”。

划重点:
🌐 OSI 发布的新定义要求 AI 系统提供训练数据、代码和设置，推动 “开放 AI” 标准化。
🦙 Meta 的 Llama 模型因未能提供训练数据而被认为不符合开放源代码标准，面临行业质疑。
⚖️ 法律纠纷加剧，Meta 及其他 AI 公司因使用版权材料而受到多方诉讼，法律责任引发关注。

Meta 宣布建造全球最长海底电缆，助力人工智能基础设施

近日，Meta 公司正式宣布了名为 Project Waterworth的重大项目。这项计划是一个历时数年的多亿美元投资，旨在建造一条超过50，000公里的海底电缆，以支持全球的人工智能基础设施。这个海底电缆项目一旦完成，将成为全球最长的海底电缆，具有抵抗船锚和其他危险因素造成损坏的能力。根据项目的规划，这条电缆将从美国东海岸延伸至西海岸，深度可达7，000米，途中将连接巴西、南非、印度和澳大利亚等多个国家和地区。通过这样的布局，Meta 希望能够为日益增长的人工智能应用提供稳定

中国信通院正式启动AI眼镜专项测试

据证券时报报道，中国信息通信研究院（信通院）正式启动了针对 AI 眼镜的专项测试。这一测试旨在推动 AI 眼镜技术的创新与行业标准化，助力行业的健康发展。图源备注：图片由AI生成，图片授权服务商Midjourney此次专项测试由信通院的泰尔终端实验室与 Sream Lab 联合进行，主要针对 RayBan-Meta Wayfarer 智能眼镜进行评估。测试内容涵盖了七个模块，包括基本配置、音频、图像、防抖、交互、续航以及安全隐私，涉及超过60个测试项目。这些测试将从功能、性能、可用性和可靠性等多个维度，

Meta首席AI科学家LeCun 的新研究：AI 仅需观看视频即可掌握物理规律

近日，Meta 的 AI 首席科学家 Yann LeCun 领导的一项研究揭示了人工智能如何通过观看视频来培养基本的物理学理解。这项研究由 Meta FAIR、巴黎大学及 EHESS 的科学家们共同完成，显示出 AI 系统能够在没有预设规则的情况下，通过自我监督学习获得直观的物理知识。研究团队采用了一种名为视频联合嵌入预测架构（V-JEPA）的新方法，与 OpenAI 的 Sora 等生成型 AI 模型相比，V-JEPA 的工作原理更接近人脑的信息处理方式。V-JEPA 并不追求生成完美的像素预测，而是专注于在一个抽象的表示空间中进行

Meta 宣布举办首届生成式 AI 开发者大会 LlamaCon，聚焦 Llama 系列模型

Meta 公司近日宣布，将于4月29日举行首届 LlamaCon 开发者大会，专注于其 Llama 系列生成式 AI 模型的最新进展。这一大会旨在为开发者提供一个平台，分享开源 AI 的最新成果，帮助他们更好地构建应用和产品。随着生成式 AI 技术的迅猛发展，Meta 希望通过此次大会进一步推动其生态系统的建设。在这场即将到来的大会上，Meta 计划展示多项与 Llama 模型相关的新功能和技术进展。Llama 模型自推出以来下载量已达数亿次，已经吸引了至少25个合作伙伴进行托管，显示出其在行业中的广泛应用。Met