LatticeFlow揭露了OpenAI等大科技公司AI模型的合规漏洞

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年10月16号 16:01

180

近日，一项由瑞士初创公司 LatticeFlow 开发的 AI 模型合规检查工具引起了广泛关注。该工具测试了多家大科技公司，包括 Meta 和 OpenAI，开发的生成性 AI 模型，结果显示，这些模型在网络安全和歧视性输出等关键领域存在明显不足。

AI,人工智能，机器人

图源备注：图片由AI生成，图片授权服务商Midjourney

自从2022年末 OpenAI 发布 ChatGPT 以来，欧盟对新的人工智能法规进行了长时间的讨论。由于 ChatGPT 的火爆以及公众对 AI 潜在风险的广泛讨论，立法者们开始着手制定针对 “通用人工智能”（GPAI）的具体规则。随着欧盟的 AI 法案逐步生效，LatticeFlow 及其合作伙伴开发的这一测试工具，成为评估各大科技公司 AI 模型的重要工具。

该工具会根据 AI 法案的要求，对每个模型进行评分，分数范围从0到1。根据 LatticeFlow 近日发布的排行榜，像阿里巴巴、Anthropic、OpenAI、Meta 和 Mistral 等公司的多个模型都获得了平均分数在0.75以上的好评。不过，LLM Checker 也发现了一些模型在合规性方面的缺陷，指出这些公司可能需要重新分配资源，以确保满足法规要求。

未能符合 AI 法案的公司将面临3500万欧元（约合3800万美元）或全球年营业额7% 的罚款。目前，欧盟仍在制定如何执行 AI 法案中关于生成性 AI 工具(例如 ChatGPT)的规则，计划在2025年春季前召集专家制定相关操作规范。

在测试中，LatticeFlow 发现，生成性 AI 模型的歧视性输出问题依然严重，反映了在性别、种族等领域的人类偏见。例如，在歧视性输出的测试中，OpenAI 的 “GPT-3.5Turbo” 模型得分为0.46。另一项针对 “提示劫持” 攻击的测试中，Meta 的 “Llama213B Chat” 模型得分为0.42，法国外企 Mistral 的 “8x7B Instruct” 模型则为0.38。

在所有参与测试的模型中，谷歌支持的 Anthropic 的 “Claude3Opus” 得分最高，达到0.89。LatticeFlow 的首席执行官 Petar Tsankov 表示，这些测试结果为公司优化模型、符合 AI 法案要求提供了方向。他指出:“尽管欧盟仍在制定合规标准，但我们已经看到模型中的一些缺口。”

此外，欧洲委员会的发言人对此次研究表示欢迎，认为这是将欧盟 AI 法案转化为技术要求的第一步。

划重点:
🌐 许多知名 AI 模型在网络安全和歧视性输出方面未能符合欧盟 AI 法案要求。
💰 未能遵守 AI 法案的公司将面临高达3500万欧元的罚款或营业额的7%。
📊 LatticeFlow 的 “LLM Checker” 工具为科技公司提供了合规性评估的新方法，帮助其提升模型质量。

OpenAI 在全球扩展人工智能代理服务Operator，提升用户体验

OpenAI 于上周五宣布，正在为澳大利亚、巴西、加拿大、印度、日本、新加坡、韩国、英国等多个国家的 ChatGPT Pro 用户推出其最新的人工智能代理工具 ——Operator。这一工具的推出标志着 OpenAI 在人工智能领域的一次重要扩展，旨在帮助用户更高效地完成各种日常任务。Operator 自今年1月在美国首次推出以来，便备受关注，成为市场上少数能够代表用户执行任务的 “人工智能代理” 之一。它能够完成多种操作，包括订票、预订餐厅、提交费用报告，甚至在电子商务网站上购物。这些功能不仅

OpenAI宣布面向多个国家推出AI代理 Operator

OpenAI 于周五宣布，将在包括澳大利亚、巴西、加拿大、印度、日本、新加坡、韩国和英国等多个国家，为 ChatGPT Pro 用户推出一款名为 “Operator” 的人工智能代理工具。此工具旨在帮助用户更高效地完成各类任务，包括订票、预订餐厅、提交费用报告和网上购物等。“Operator” 最初于今年1月在美国推出，作为市场上几款 “人工智能代理” 工具之一，OpenAI 希望通过这一产品，为用户提供更便捷的服务。需要注意的是，这一工具目前仅对每月付费200美元的 ChatGPT Pro 用户开放，用户可以通过

微软备战OpenAI的GPT-5模型，预计即将发布GPT-4.5

近日，有消息人士透露，微软正在积极准备即将发布的 OpenAI 新模型 ——GPT-4.5及 GPT-5。根据 OpenAI 首席执行官山姆・阿特曼的说法，GPT-4.5将在数周内正式推出，微软则预计最早将在下周托管这一新 AI 模型。GPT-4.5代号 “猎户座”，是 OpenAI 的下一代模型，并且是公司最后一个非链式思维（non-chain-of-thought）模型。业内人士指出，GPT-4.5的能力有望大幅超越其前任 GPT-4。图源备注：图片由AI生成，图片授权服务商Midjourney不过，眼下的焦点不仅仅停留在 GPT-4.5，微软也在期待 GPT-5的到来。根据消

OpenAI Operator工具向多国Pro用户推出欧洲地区推广仍在进行

北京时间，2025 年 2 月 21日讯：OpenAI 今日宣布，其人工智能工具 Operator 已正式向澳大利亚、巴西、加拿大、印度、日本、新加坡、韩国、英国以及 ChatGPT 可用的多数地区的 Pro 用户推出。这一消息通过 X 平台发布，标志着 Operator 的全球化推广迈出重要一步。然而，欧盟、瑞士、挪威、列支敦士登和冰岛的推广工作仍在进行中，具体进展有待后续更新。Operator 扩展至多国Operator 是 OpenAI 开发的一款 AI 代理工具，能够通过视觉界面控制浏览器，自主完成订票、购物等网络任务。该工具最初于

AI新闻资讯