Groq公司推出新型AI处理器LPU，性能优秀但成本和能耗仍待改进

机器之心

发布于AI新闻资讯 · 1 分钟阅读 · 2024年3月6号 15:33

Groq公司推出了一种新型AI处理器LPU，该处理器在语言处理任务上表现优秀，挑战了传统GPU的地位。虽然LPU在效率和成本效益上具有优势，但其应用范围较窄。Groq公司对LPU的设计和技术进行了详细介绍和解释，展示了其潜在的影响和未来发展。

Sakana AI发布“AI CUDA工程师”：自动化优化CUDA内核，速度提升高达100倍

日本人工智能初创公司Sakana AI宣布推出“AI CUDA工程师”（AI CUDA Engineer），这一创新性的AI智能体系统旨在自动化生产高度优化的CUDA内核，显著提升机器学习操作的运行效率。根据X平台上的最新消息，该系统通过进化的大型语言模型(LLM)驱动代码优化技术，将常见PyTorch操作的运行速度提高了10至100倍，标志着AI技术在GPU性能优化领域的重大突破。Sakana AI表示，CUDA内核作为GPU计算的核心，直接编写和优化通常需要深厚的专业知识和高技术门槛，而现有框架如PyTorch虽然使用便捷，但在性能上往

深推理模型崛起！Together AI融资3.05亿美元助推GPU需求

在 AI 行业，Together AI 最近宣布完成了一轮3.05亿美元的 B 轮融资，这一消息引起了广泛关注。该公司的崛起与其新推出的深度理模型 DeepSeek-R1密切相关。与最初的担忧相反，许行业专家认为，深度推理的进步并没有降低对基础设施的需求，反而在不断提升这一需求。图源备注：图片由AI生成，图片授权服务商Midjourney自2023年成立以来，Together AI 旨在简化企业对开源大型语言模型（LLM）的使用。随着时间的推移，该公司逐步扩展其平台，提供了一个名为 “Together 平台” 的解决方案，支持在虚

xAI 新模型 Grok 3 逻辑推理能力获 OpenAI 创始人点赞

埃隆・马斯克的人工智能公司 xAI 于本周一发布了其最新的语言模型 Grok3，标志着该公司在人工智能领域的重要进展。据马斯克介绍，新模型所需的计算能力是其前身的十倍，使用了位于孟菲斯的数据中心，配备了约20万块 GPU。Grok3系列模型推出了多种变体，其中包括一个精简版，旨在提高速度但牺牲部分准确性。此外，新的 “推理” 模型专门设计用于解决数学和科学问题。用户可以通过 Grok 界面中的 “思考” 和 “大脑” 设置来调整这些功能。xAI 表示，这一版本尚未最终定型，模型仍

马斯克首次披露 Grok 3 的训练成本：高达 20 万块英伟达 GPU

近日，马斯克在直播中正式推出了全新的聊天机器人 Grok3，并透露了该模型训练的惊人成本。Grok3目前已面向 Premium + 订阅用户开放，并在多个评测领域表现出色，甚至超过了市场上其他竞争对手，如 Gemini、DeepSeek 和 ChatGPT。马斯克在直播中介绍，Grok3的训练过程中共计消耗了20万块英伟达 GPU，这一数字让人震惊。在此之前，Grok2的训练只使用了约2万块 GPU，Grok3的计算能力提升可谓是质的飞跃。为了支持如此庞大的训练规模，xAI 公司新建了名为 “Colossus” 的超级计算数据中心，堪称全球最