大模型推理bug!问题翻转回答全错 GPT到Llama无一幸免

36氪

发布于AI新闻资讯 · 1 分钟阅读 · 2023年10月8号 14:05

最近,科学家们发现一个“逆转诅咒”的现象——大模型无法进行逆向推理。论文通过虚拟和真实场景实验表明,不管体量大小,顶流大模型都存在这个bug。这暴露了大模型逻辑推理能力的局限,可能影响重要应用领域,存疑其可靠性。基于大模型的AI应用日益广泛,逆转诅咒警示人们不要对其可靠性过于乐观。

DeepSeek 开源周首日：发布大模型加速利器FlashMLA 解码性能飙升至3000GB/s

DeepSeek 开源周首日正式开源其最新技术成果FlashMLA，这是一款专为英伟达Hopper架构GPU打造的高效多层注意力（Multi-Layer Attention）解码内核。该技术特别针对变长序列场景进行优化，可显著提升大模型推理性能。FlashMLA的核心技术特性包括对BF16精度的全面支持，以及采用块大小为64的页式键值缓存（Paged KV Cache）系统，实现更精确的内存管理。在性能表现方面，基于CUDA12.6平台，FlashMLA在H800SXM5GPU上创下了显著成绩:在内存受限场景下达到3000GB/s的处理速度，在计算受限场景下则实现580TFLOPS的算力

DeepSeek-R1 登顶 Hugging Face：以10000 赞力压 150 万个模型

今日凌晨，全球最大开源平台之一 Hugging Face 的首席执行官 Clement Delangue 在社交平台发文宣布，DeepSeek-R1在 Hugging Face 上获得了超过10000个赞，成为该平台近150万个模型中最受欢迎的大模型。这一里程碑式的成就标志着 DeepSeek-R1在全球 AI 社区中的广泛认可与影响力。DeepSeek-R1的崛起速度令人瞩目。在其发布仅数周后，Clement Delangue 就曾发文表示，该模型已成为 Hugging Face 上最受欢迎的模型之一。如今，其受欢迎程度进一步攀升，以超过10000个赞的亮眼成绩，力压平台上近150万个模型，成功登顶

马斯克宣布Grok 3将全面免费，Premium+用户气晕了

在刚刚发布48小时后，Grok3的推出引发了用户们的强烈反应，尤其是刚刚花费40美元订阅 X 平台 Premium + 服务的用户。在他们满怀期待地准备体验这一最新 AI 大模型时，却发现马斯克在社交媒体 X 上的宣布:Grok3将 “短期内免费提供给所有人”，令他们感到心寒。XAI 官方账号甚至声称，免费将持续 “直到服务器崩溃”。在 Grok3发布后不久，马斯克在社交平台上晒出 Grok 应用在苹果应用商店的免费生产力工具榜单，显示其首次超过了 ChatGPT。用户们在评论区对此感到困惑，有人感叹:“我花钱升

AI新闻资讯

大模型推理bug!问题翻转回答全错 GPT到Llama无一幸免

36氪

相关AI新闻推荐

DeepSeek 开源周首日：发布大模型加速利器FlashMLA 解码性能飙升至3000GB/s

DeepSeek-R1 登顶 Hugging Face：以10000 赞力压 150 万个模型

小米超级小爱已重新接入DeepSeek R1大模型

马斯克宣布Grok 3将全面免费，Premium+用户气晕了