研究发现:大型语言模型可能更倾向于撒谎而非承认无知

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年9月29号 10:56

最近，西班牙瓦伦西亚理工大学的科学家进行了一项研究，揭示了大型语言模型如GPT、LLaMA和BLOOM在处理问题时可能更倾向于撒谎而非承认无知的现象。研究发现，随着AI模型复杂性的增加，它们在面对复杂问题时的准确性下降，且更可能编造答案。

大模型元宇宙 (2)

研究人员发现，人类志愿者在测试中也很难识别这些错误答案，这暗示了AI谎言可能对人类构成的潜在风险。科学家建议，为了提升AI的可靠性，需要在简单问题上提高AI的性能，并鼓励AI在面对难题时选择不回答，以便用户能更准确地评估AI的可信度。

研究结果表明，大型语言模型在回答问题时可能会优先考虑提供看似合理的答案，而不是承认自己的无知。这可能导致用户对AI的信任度下降，甚至可能导致严重的后果。科学家呼吁开发者和研究人员需要关注这一问题，改进AI的回答策略，以确保AI的可靠性和安全性。

仅用四周时间！富士康推出中文大语言模型FoxBrain

富士康旗下的鸿海研究院近日发布了一款全新的传统中文大型语言模型（LLM）——FoxBrain。这一模型的推出引起了业界的广泛关注，标志着在中文人工智能领域的一次重要进展。FoxBrain 的训练过程在短短四周内完成，展示了强大的技术能力和高效的研发速度。图源备注：图片由AI生成，图片授权服务商MidjourneyFoxBrain 的研发旨在提升传统中文的处理能力，满足日益增长的市场需求。在互联网及社交媒体的推动下，中文内容的生成和处理对技术的要求越来越高，FoxBrain 的推出正是为了应对这种

全球 75.9% 办公室已将ChatGPT纳入工作流程，AI 助力职场新变革

根据 DeskTime 最近发布的一项研究，ChatGPT 已经成为全球办公室中使用最广泛的人工智能工具，预计到2024年底，其在职场中的采用率将达到75.9%。这一调查覆盖了97家公司和2385名员工，时间跨度从2023年1月至2024年12月。随着 AI 技术的发展，ChatGPT 在工作中的应用场景也不断扩大，其便捷性和高效性赢得了员工的普遍欢迎。图源备注：图片由AI生成，图片授权服务商Midjourney研究结果显示，印度的 ChatGPT 采用率最高，达到92%，而美国的采用率则从2023年的68% 小幅上升至72%。尽管略低于全球平均水平

AI流量吞噬者:ChatGPT跻身全球十大网站，却几乎不分享流量

根据Similarweb的最新数据，ChatGPT在2025年2月的访问量达到了创纪录的3.9050亿次，较1月份微增1.44%。虽然环比增长放缓，但与2024年2月相比，同比增长仍然强劲，高达137%。这一持续增长使ChatGPT在全球网站排名中继续攀升，目前在全球桌面网站中排名第五，在结合桌面和移动流量时位列第七。数据显示，ChatGPT占据全球网络流量的1.86%，每月访问量高达40亿，已稳居全球十大网站之列，尽管与谷歌等科技巨头相比仍有差距。ChatGPT.com 的流量在2024年夏季至秋季期间呈现强劲增长，随后趋于平稳。从

微软CEO表示AI模型“正在商品化” 系统整合与产品开发成关键

在最近的一期播客中，微软首席执行官萨提亚・纳德拉表示，随着语言模型的不断成熟，AI 模型正逐渐走向标准化和商品化。他指出，这一变化促使企业在人工智能（AI）开发上的战略重心从单纯的模型研发转向系统整合与产品开发。纳德拉强调，“模型本身并不足够，企业需要关注完整的系统架构以及成功的产品。” 他认为，当前 AI 行业正经历一场 “浪潮般的活动”，自从2022年11月 ChatGPT 问世以来，涉及芯片、数据中心、框架、基础模型、垂直 AI 公司、消费者硬件与软件等多个领域的