近日,Meta 的工程师们在匿名社交平台 TeamBlind 上吐露心声,揭示了中国公司 DeepSeek 所研发的 AI 模型 R1所带来的巨大压力。DeepSeek 被认为是全球首个与 OpenAI 的 o1模型相提并论的开源 AI 模型,而与 OpenAI 相比,R1不仅开源程度更高,而且训练成本低得惊人,仅为550万美元。
相比之下,Meta 的高管年薪常常超过整个 DeepSeek V3的训练成本,这使得 Meta 的管理层倍感尴尬。
据内部消息透露,DeepSeek V3的出现已在去年令 Meta 感受到不小的压力。Meta 的工程师们正在加紧时间,努力分析 DeepSeek 的技术,希望能够尽快复制其中的关键技术。过去,全球的 AI 研究者们都在追逐美国的大模型,而如今,局势发生了变化,美国工程师们开始逆向工程中国的 AI 技术。
DeepSeek 不仅在基准测试中超过了 Meta 的 Llama4,而且在多个领域的表现上也令业界瞩目。DeepSeek 通过大规模强化学习(RL)和未经过监督微调(SFT)等技术,实现了极高的推理性能。这种技术自信让美国的部分网友开始反思中国在 AI 领域的迅速崛起。
划重点:
🌟 DeepSeek R1模型的训练成本仅为550万美元,性能可与 OpenAI 的 o1相媲美。
👨💻 Meta 的高管薪资超过 DeepSeek 的训练成本,管理层对此感到压力巨大。
📈 DeepSeek 的成功引发了美国科技公司的恐慌,挑战了美国在 AI 领域的主导地位。