大模型也会“说谎”？哈佛最新研究揭秘AI“幻觉”真相

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · Oct 25, 2024

310

大型语言模型（LLM）的横空出世，尤其是ChatGPT等应用的普及，彻底改变了人机交互的方式。这些模型能够生成连贯且全面的文本，令人印象深刻。然而，尽管能力强大，LLM却容易产生“幻觉”，即生成看似真实但实际上是虚构、无意义或与提示不符的内容。

哈佛大学的研究人员对LLM“幻觉”现象进行了深入研究，发现其根源在于LLM的工作原理。 LLM通过对海量文本数据进行机器学习来构建概率模型，并根据词语共现的概率来预测下一个词语。换句话说，LLM并非真正理解语言的含义，而是根据统计概率进行预测。

研究人员将LLM比作“众包”，认为LLM实际上是在输出“网络共识”。就像维基百科或Reddit等平台一样，LLM从大量文本数据中提取信息，并生成最常见的答案。由于大多数语言的使用都是为了描述世界，因此LLM生成的答案通常是准确的。

然而，当LLM遇到模糊、有争议或缺乏共识的主题时，就会出现“幻觉”。为了验证这一假设，研究人员设计了一系列实验，测试了不同LLM在处理不同主题时的表现。实验结果表明，LLM在处理常见主题时表现良好，但在处理模糊或有争议的主题时，准确性明显下降。

这项研究表明，LLM虽然是强大的工具，但其准确性取决于训练数据的质量和数量。在使用LLM时，尤其是在处理模糊或有争议的主题时，需要谨慎对待其输出结果。这项研究也为LLM的未来发展提供了方向，即需要改进LLM处理模糊和有争议主题的能力，并提高其输出结果的可解释性。

论文地址：https://dl.acm.org/doi/pdf/10.1145/3688007

AI新闻资讯

最新AI日报

AI 商用·开源产品库

AI 产品排行榜

AI产品提交

AI工具导航

模型库

大模型排行榜

模型供应商

大模型选型对比

大模型费用计算器

大模型竞技场

MCP服务端

MCP客户端

MCP教程与实践

MCP排行榜

MCP服务提交

MCP实验场

MCP服务调试器

GEO全景分析平台

GEO品牌监控分析

GEO排名查询工具

GEO推广链接检测

GEO排名优化系统

GEO 大模型推荐优化

模型个人电脑配置检测器

模型部署服务器配置计算器

大模型也会“说谎”？哈佛最新研究揭秘AI“幻觉”真相

AIbase基地

本文来自AIbase日报

相关AI新闻推荐

社交媒体新格局：OpenAI 拟开发“仅限真人”社交网络

​昆仑天工发布音乐大模型 Mureka V8：实现从“可生成”到“可发布”的跃迁

​ServiceNow 联手 Anthropic：双巨头合作，开启“多模型”企业 AI 新纪元

蚂蚁灵波开源世界模型LingBot-World，高保真高动态，毫秒级实时交互

​AI 幻觉引发外交风波:英国警方紧急停用 Microsoft Copilot

蚂蚁集团入股 AI 大模型公司西湖心辰

昆仑万维发布 Mureka V8：AI 音乐从“可生成”跨向“可发布”

扎克伯格:Meta 步入“交付年”，超级智能实验室领衔1350亿美元 AI 布局

突破技术瓶颈：MiniMax Music 2.5 音乐大模型正式发布

​亚马逊再裁1. 6 万人：加速组织“初创化”，AI 替代白领潮初现