越聪明越会撒谎？研究警告 AI 误导性回答日益严重！

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年9月29号 9:32

104

随着人工智能聊天机器人的不断进化，它们不仅变得更强大，回答问题的能力也越来越出色，但令人担忧的是，这些 “聪明” 的 AI 似乎更容易撒谎，而不是拒绝回答自己无法处理的问题。

机器人人工智能 AI

图源备注:图片由AI生成，图片授权服务商Midjourney

一项最新的研究揭示了这一现象，研究发表于《自然》杂志，分析了几款当前市场上领先的语言模型，包括 OpenAI 的 GPT 和 Meta 的 LLaMA，还有开源模型 BLOOM。

研究显示，虽然这些 AI 的回答在许多情况下变得更为准确，但它们的可靠性却整体下降，错误答案的比例比旧模型更高。

研究的共同作者何塞・埃尔南德斯 - 奥拉洛指出:“如今，它们几乎什么问题都在回答，这意味着正确的答案多了，但错误的答案也随之增加。” 对此，未参与该研究的格拉斯哥大学科学与技术哲学家迈克・希克斯则表示:“这看起来像是我们所称的‘胡说八道’，它们变得更擅长于伪装出知识渊博的样子。”

在研究中，模型们被问及从数学到地理的各种问题，还需执行诸如按指定顺序列出信息等任务。虽然更大、更强的模型在总体上提供的回答最为准确，但在难度较高的问题上，它们的表现却不尽如人意，准确率反而较低。

研究者指出，OpenAI 的 GPT-4和 o1在回答问题时表现得尤为突出，几乎回答了所有问题。然而，所有受研究的语言模型都呈现出这种趋势，尤其是 LLaMA 系列模型，在简单问题上，甚至没有一款模型的准确率能够达到60%。简单来说，模型越大，参数和训练数据越多，错误答案的比例也随之增加。

尽管 AI 在复杂问题上的应对能力在不断提升，但它们在处理简单问题时的错误仍然令人担忧。研究者们认为，我们可能会被这些模型在复杂问题上的表现所吸引，而忽视了它们在简单问题上显而易见的缺陷。

为了应对这一问题，研究者建议可以为语言模型设置一个阈值，当问题变得复杂时，程序可以让聊天机器人选择说:“对不起，我不知道。” 不过，AI 公司可能并不希望这样做，因为这可能会暴露出技术的局限性。

划重点:
🔍 AI 聊天机器人变得更强大，但撒谎的概率也增加。
📉 研究显示，越大的语言模型，错误答案的比例越高。
🤖 研究者建议为 AI 设定回答阈值，鼓励其拒绝回答不确定的问题。

人工智能席卷华尔街，高盛为其员工推出了AI助手

华尔街在人工智能技术的应用上走在了前沿，尤其是生成式人工智能的迅猛发展。高盛近日宣布推出一款名为 “GS AI 助手” 的生成式 AI 工具，旨在帮助其银行家、交易员和资产经理更高效地完成工作。这一工具目前已向约1万名员工推出，预计在今年内将覆盖所有知识工作者。图源备注：图片由AI生成，图片授权服务商Midjourney高盛首席信息官马尔科・阿根提表示，这款 AI 助手将能够处理多种任务，包括撰写邮件、校对文档以及将代码从一种语言翻译成另一种语言。他强调，这款工具具有

程序员购买OGOpenAI.com域名转向DeepSeek

最近，一名软件工程师以 “不到一顿 Chipotle 餐的价格” 购买了 OGOpenAI.com 域名，并将其重定向至中国人工智能实验室 DeepSeek 的网站。该实验室在开源 AI 领域崭露头角，吸引了广泛的关注。据软件工程师阿纳奈・阿罗拉（Ananay Arora）向《TechCrunch》透露，他的初衷是为了支持 DeepSeek，因为该实验室最近推出了一款名为 DeepSeek-R1的开放版本模型，声称在某些基准测试中表现优于 OpenAI 的 o1。阿罗拉表示，DeepSeek 的模型可以离线使用，任何具备必要硬件的开发者都可以免费获取，类似于 OpenAI 早

OpenAI 在印度法院抗辩，拒绝删除 ChatGPT 训练数据

近日，美国人工智能公司 OpenAI 对印度德里高等法院的裁定提出了抗辩，认为该法院没有权利要求其删除 ChatGPT 的训练数据。此案源于印度新闻机构 ANI 于去年11月提起的诉讼，声称 OpenAI 未经授权使用其已发布的内容来训练 ChatGPT。ANI 要求将其内容从模型的训练数据集中删除，并指控 OpenAI 侵犯版权。在1月10日提交给德里高等法院的一份86页的文件中，OpenAI 表示，根据美国法律，正在进行诉讼时必须保留训练数据。因此，来自印度的删除数据命令与其法律责任相抵触。OpenAI 强调，由于公司

字节加码AGI：豆包大模型组建“Seed Edge”团队，探索AI未来

据媒体报道，字节跳动正加大在人工智能（AI）领域的基础研究投入，其豆包大模型团队已在内部组建一支代号为“Seed Edge”的AGI长期研究团队。该团队旨在探索更长周期、具有不确定性和大胆的AGI研究课题，体现了字节在AI领域的战略决心。据披露，“Seed Edge”团队已初步确定了五大研究方向，包括探索推理能力的边界、探索感知能力的边界、探索软硬一体的下一代模型设计、探索下一代AI学习范式以及探索下一个scaling方向。这表明字节在AGI的布局并非仅限于应用层面，而是深入到了基础

AI新闻资讯