AI产品榜

AI产品榜

搜索全球AI产品动态

搜索全球AI信息，发现AI新机遇

新闻资讯
产品应用
变现案例
AI教程

类型 :

新闻资讯
产品应用
变现案例
AI教程

2024-10-11 09:35:13.AIbase

DeepMind推新基准Michelangelo：揭示长上下文 LLM推理缺陷

最近，超长上下文窗口的大型语言模型（LLMs）成为了人们讨论的热点。这些模型能够在一个提示中处理数十万甚至上百万个标记，为开发者开启了许多新的可能性。不过，这些长上下文 LLM 到底能多好地理解和利用所接收到的大信息呢?为了解决这个问题，谷歌 DeepMind 的研究人员推出了名为 Michelangelo 的新基准，旨在评估长上下文推能力。研究结果表明，尽管当前的顶尖模型在从大量上下文数据中提取信息方面取得了一定进展，但在需要推理和理解数据结构的任务上仍然存在困难。随着长上

DeepMind推新基准Michelangelo：揭示长上下文 LLM推理缺陷

2023-10-08 14:05:27.AIbase

大模型推理bug!问题翻转回答全错 GPT到Llama无一幸免

["<b>大模型的应用趋势</b>:文章提到基于大模型,人工智能快速渗入各行各业,但同时也暴露了大模型在逻辑推理上的缺陷。","<b>大模型的知识限制</b>: OpenAI创始成员直言,大模型的知识比你想象的要不完整的多。虚构和现实场景测试都表明,大模型存在“逆转诅咒”,无法进行逆向推理。","<b>大模型的可靠性存疑</b>:逻辑推理是大模型正确解决问题的基础。逆转诅咒表明大模型存在推理能力缺陷,这可能影响各类重要应用领域,大模型的可靠性存疑。"]