AMD AI芯片2024年收入预计超20亿美元 市值大涨9%

DeepSeek 开源周首日正式开源其最新技术成果FlashMLA,这是一款专为英伟达Hopper架构GPU打造的高效多层注意力(Multi-Layer Attention)解码内核。该技术特别针对变长序列场景进行优化,可显著提升大模型推理性能。FlashMLA的核心技术特性包括对BF16精度的全面支持,以及采用块大小为64的页式键值缓存(Paged KV Cache)系统,实现更精确的内存管理。在性能表现方面,基于CUDA12.6平台,FlashMLA在H800SXM5GPU上创下了显著成绩:在内存受限场景下达到3000GB/s的处理速度,在计算受限场景下则实现580TFLOPS的算力
“你们都搞错了!” 近日, 英伟达掌门人 罕见 “ 动怒 ” , 公开回应了市场对中国 AI 创企 DeepSeek 发布 R1模型的 “ 过度 ” 反应。 在黄仁勋看来, DeepSeek R1的 横空出世非但不是 对 Nvidia 的 “ 饭碗 ” 构成 威胁, 反而是加速AI发展的重大利好, 对英伟达而言 更是 “ 神助攻 ” 一般的存在。事情起因于今年1月 DeepSeek 发布 R1模型 后, 市场普遍认为 R1的高效性意味着未来AI发展将不再需要如此庞大的算力资源, 这直接导致Nvidia股价单日暴跌16.9%, 市值瞬间蒸发数百亿美元。 市场 的恐慌情
近日,马斯克在直播中正式推出了全新的聊天机器人 Grok3,并透露了该模型训练的惊人成本。Grok3目前已面向 Premium + 订阅用户开放,并在多个评测领域表现出色,甚至超过了市场上其他竞争对手,如 Gemini、DeepSeek 和 ChatGPT。马斯克在直播中介绍,Grok3的训练过程中共计消耗了20万块英伟达 GPU,这一数字让人震惊。在此之前,Grok2的训练只使用了约2万块 GPU,Grok3的计算能力提升可谓是质的飞跃。为了支持如此庞大的训练规模,xAI 公司新建了名为 “Colossus” 的超级计算数据中心,堪称全球最
显卡市场即将迎来新一轮的激烈竞争。Nvidia对其即将推出的RTX5070显卡寄予厚望,声称其性能可媲美RTX4090,而售价仅为549美元。然而,这一说法是否属实,还有待市场检验。Nvidia最初计划于2月发布RTX5070,但根据其产品页面今天最新透露的信息,发布日期已推迟至3月5日。不过,Nvidia仍计划在2月20日,即AMD预定活动的前一周,推出售价749美元的RTX5070Ti。目前,AMD已宣布将于2月28日举行一场流媒体活动,预计将展示Radeon RX9070和9070XT显卡。AMD此前曾表示,其产品策略并非直接与Nvidia的顶级显卡竞