Groq公司推出了一种新型AI处理器LPU,该处理器在语言处理任务上表现优秀,挑战了传统GPU的地位。虽然LPU在效率和成本效益上具有优势,但其应用范围较窄。Groq公司对LPU的设计和技术进行了详细介绍和解释,展示了其潜在的影响和未来发展。
日本人工智能初创公司Sakana AI宣布推出“AI CUDA工程师”(AI CUDA Engineer),这一创新性的AI智能体系统旨在自动化生产高度优化的CUDA内核,显著提升机器学习操作的运行效率。根据X平台上的最新消息,该系统通过进化的大型语言模型(LLM)驱动代码优化技术,将常见PyTorch操作的运行速度提高了10至100倍,标志着AI技术在GPU性能优化领域的重大突破。Sakana AI表示,CUDA内核作为GPU计算的核心,直接编写和优化通常需要深厚的专业知识和高技术门槛,而现有框架如PyTorch虽然使用便捷,但在性能上往
在 AI 行业,Together AI 最近宣布完成了一轮3.05亿美元的 B 轮融资,这一消息引起了广泛关注。该公司的崛起与其新推出的深度理模型 DeepSeek-R1密切相关。与最初的担忧相反,许行业专家认为,深度推理的进步并没有降低对基础设施的需求,反而在不断提升这一需求。图源备注:图片由AI生成,图片授权服务商Midjourney自2023年成立以来,Together AI 旨在简化企业对开源大型语言模型(LLM)的使用。随着时间的推移,该公司逐步扩展其平台,提供了一个名为 “Together 平台” 的解决方案,支持在虚
埃隆・马斯克的人工智能公司 xAI 于本周一发布了其最新的语言模型 Grok3,标志着该公司在人工智能领域的重要进展。据马斯克介绍,新模型所需的计算能力是其前身的十倍,使用了位于孟菲斯的数据中心,配备了约20万块 GPU。Grok3系列模型推出了多种变体,其中包括一个精简版,旨在提高速度但牺牲部分准确性。此外,新的 “推理” 模型专门设计用于解决数学和科学问题。用户可以通过 Grok 界面中的 “思考” 和 “大脑” 设置来调整这些功能。xAI 表示,这一版本尚未最终定型,模型仍
近日,马斯克在直播中正式推出了全新的聊天机器人 Grok3,并透露了该模型训练的惊人成本。Grok3目前已面向 Premium + 订阅用户开放,并在多个评测领域表现出色,甚至超过了市场上其他竞争对手,如 Gemini、DeepSeek 和 ChatGPT。马斯克在直播中介绍,Grok3的训练过程中共计消耗了20万块英伟达 GPU,这一数字让人震惊。在此之前,Grok2的训练只使用了约2万块 GPU,Grok3的计算能力提升可谓是质的飞跃。为了支持如此庞大的训练规模,xAI 公司新建了名为 “Colossus” 的超级计算数据中心,堪称全球最