xAI 新模型 Grok 3 逻辑推理能力获 OpenAI 创始人点赞

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2025年2月19号 10:19

148

埃隆・马斯克的人工智能公司 xAI 于本周一发布了其最新的语言模型 Grok3，标志着该公司在人工智能领域的重要进展。据马斯克介绍，新模型所需的计算能力是其前身的十倍，使用了位于孟菲斯的数据中心，配备了约20万块 GPU。

Grok3系列模型推出了多种变体，其中包括一个精简版，旨在提高速度但牺牲部分准确性。此外，新的 “推理” 模型专门设计用于解决数学和科学问题。用户可以通过 Grok 界面中的 “思考” 和 “大脑” 设置来调整这些功能。xAI 表示，这一版本尚未最终定型，模型仍在持续训练中，团队计划在未来几周内进行改进。

根据 AI 基准测试平台 lmarena.ai 的数据，Grok3在聊天机器人领域的得分超过了1400，成为领先者，涵盖编程等所有类别，超越了 OpenAI、Anthropic 和谷歌的模型。然而，实际性能可能与基准结果有所不同。例如，尽管 Claude3.5Sonnet 在编码基准测试中的得分低于某些模型，但许多用户仍认为它是编程任务的更优选择。

OpenAI 创始人安德烈・卡尔帕西（Andrej Karpathy）获得了 Grok3的早期访问权，他对该模型的逻辑推理能力给予了高度评价。“思考” 功能能够成功处理复杂任务，比如计算 GPT-2的训练 flops 或为棋盘游戏创建六边形网格，这些能力在之前仅限于 OpenAI 的高端模型 o1-pro。此外，该功能还提高了基本数学操作的准确性，比如字母计数和比较小数。

在新搜索功能方面，卡尔帕西指出，DeepSearch 的质量与 Perplexity 的研究工具相当，可以提供关于即将发布的苹果产品和 Palantir 股票动态等主题的相关答案。然而，他也发现了一些明显的问题:模型有时会生成虚假的网址，做出不支持的声明，并且仅在特定提示下引用 X 的帖子。

它似乎还对自己的存在缺乏意识，遗漏了 xAI 在主要 AI 实验室中的位置。这些局限性使 DeepSearch 尚未达到 OpenAI “深度研究” 的质量水平，并且在幽默和伦理问题上表现不佳。

Sakana AI发布“AI CUDA工程师”：自动化优化CUDA内核，速度提升高达100倍

日本人工智能初创公司Sakana AI宣布推出“AI CUDA工程师”（AI CUDA Engineer），这一创新性的AI智能体系统旨在自动化生产高度优化的CUDA内核，显著提升机器学习操作的运行效率。根据X平台上的最新消息，该系统通过进化的大型语言模型(LLM)驱动代码优化技术，将常见PyTorch操作的运行速度提高了10至100倍，标志着AI技术在GPU性能优化领域的重大突破。Sakana AI表示，CUDA内核作为GPU计算的核心，直接编写和优化通常需要深厚的专业知识和高技术门槛，而现有框架如PyTorch虽然使用便捷，但在性能上往

马斯克的xAI游戏工作室或将颠覆游戏行业：Grok 3助力快速游戏开发

埃隆·马斯克（Elon Musk）旗下的人工智能公司xAI宣布，其新成立的游戏工作室将彻底改变游戏行业的现状。据悉，该工作室将利用最新发布的AI模型Grok3，让游戏开发变得前所未有的高效与便捷。用户现已能够在短短几分钟内通过Grok3生成完整的游戏，甚至只需简单提问即可提升游戏的图形质量。图源备注：图片由AI生成，图片授权服务商MidjourneyxAI游戏工作室的这一创新引发了业界广泛关注。报道称，Grok3已展示出强大的游戏生成能力，其中包括10款由AI驱动的游戏范例。值得一提的是，首款

华人学者引领AI创新，Grok 3在App Store一鸣惊人

近日，xAI 公司推出的最新人工智能模型 Grok3在美国 App Store 上迅速攀升至榜首，成为用户热议的焦点。这一成就的背后，除了 Grok3的强大功能外，还有两位华人学者的出色贡献。他们分别是多伦多大学的助理教授 Jimmy Ba 和 xAI 的联创吴怀宇（Tony Wu）。值得注意的是，吴怀宇不仅是团队中唯一的95后，而且他的学术背景和开发经历更是引人瞩目，曾参与了 AlphaGeometry 和 AlphaStar 的核心开发。在刚刚结束的发布会上，Grok3展示了其在推理、数学、编码等多个领域的卓越能力。xAI 的官方博客称其

马斯克宣布Grok 3将全面免费，Premium+用户气晕了

在刚刚发布48小时后，Grok3的推出引发了用户们的强烈反应，尤其是刚刚花费40美元订阅 X 平台 Premium + 服务的用户。在他们满怀期待地准备体验这一最新 AI 大模型时，却发现马斯克在社交媒体 X 上的宣布:Grok3将 “短期内免费提供给所有人”，令他们感到心寒。XAI 官方账号甚至声称，免费将持续 “直到服务器崩溃”。在 Grok3发布后不久，马斯克在社交平台上晒出 Grok 应用在苹果应用商店的免费生产力工具榜单，显示其首次超过了 ChatGPT。用户们在评论区对此感到困惑，有人感叹:“我花钱升