AI服务器市场激增,训练产品供不应求

日本人工智能初创公司Sakana AI宣布推出“AI CUDA工程师”(AI CUDA Engineer),这一创新性的AI智能体系统旨在自动化生产高度优化的CUDA内核,显著提升机器学习操作的运行效率。根据X平台上的最新消息,该系统通过进化的大型语言模型(LLM)驱动代码优化技术,将常见PyTorch操作的运行速度提高了10至100倍,标志着AI技术在GPU性能优化领域的重大突破。Sakana AI表示,CUDA内核作为GPU计算的核心,直接编写和优化通常需要深厚的专业知识和高技术门槛,而现有框架如PyTorch虽然使用便捷,但在性能上往
在 AI 行业,Together AI 最近宣布完成了一轮3.05亿美元的 B 轮融资,这一消息引起了广泛关注。该公司的崛起与其新推出的深度理模型 DeepSeek-R1密切相关。与最初的担忧相反,许行业专家认为,深度推理的进步并没有降低对基础设施的需求,反而在不断提升这一需求。图源备注:图片由AI生成,图片授权服务商Midjourney自2023年成立以来,Together AI 旨在简化企业对开源大型语言模型(LLM)的使用。随着时间的推移,该公司逐步扩展其平台,提供了一个名为 “Together 平台” 的解决方案,支持在虚
有消息透露称,微软的工程师正在全力以赴,为 OpenAI 即将推出的 GPT-4.5和 GPT-5模型准备服务器容量。OpenAI 首席执行官山姆・阿尔特曼(Sam Altman)近日确认,GPT-4.5将在几周内发布,而微软预计将在下周推出这一新 AI 模型。被称为 Orion 的 GPT-4.5将成为 OpenAI 的下一个前沿模型,并且是该公司最后一个非思维链模型。尽管 OpenAI 已经透露 GPT-4.5的功能将比前一代 GPT-4强大得多,但他们的目光也在 GPT-5模型上,后者将包含更多重大的技术创新。根据目前的计划,微软预计 GPT-5将在今年5月底推出,
北京时间2月20日,马斯克创立的人工智能公司 xAI 宣布其最新的 Grok3模型正式开放免费使用,用户可以在不支付任何费用的情况下体验这一先进的 AI 技术,直至服务器承载能力达到极限。这一举动引起了广泛关注,尤其是在当前竞争激烈的 AI 市场中。Grok3的推出标志着 xAI 在 AI 领域的又一重要进展。用户只需登录即可体验这一强大的 AI 工具,而那些订阅了 X Premium + 和 SuperGrok 服务的用户则能够享受更多高级功能,包括语音模式等独特体验。此外,订阅用户还将获得 Grok3的深度使用权限,这