正文:近期,中国的 DeepSeek 团队重磅推出了其最新开源大模型 R1,受到了广泛关注。R1模型的性能表现极其出色,在多项测试中均超越了 OpenAI 的 o1模型,尤其是在数学和编程方面的评估中表现优异。在最新的美国 AIME2024测试中,R1以79.8分的成绩超越 o1的79.2分。在 MATH-500测试中,R1获得了97.3分,同样领先于 o1的96.4分。此外,在 SWE-bench Verified 测试中,R1得分为49.2,也超过了 o1的48.9分。虽然在代码测试 Codeforces 中,R1仅比 o1低0.3分,但整体性能与 o1模型相当。除了性能,R1的成本优势更为引人
DeepSeek近日正式发布并开源了其最新研发的大型语言模型R1,该模型在性能上表现出色,被认为可与OpenAI的o1正式版相媲美。这一举措不仅标志着国产AI技术的又一次重大突破,也为全球AI开发者带来了新的选择。DeepSeek R1在后训练阶段大规模应用了强化学习技术,即便是在极少标注数据的情况下,也显著提升了模型的推理能力。在数学、代码、自然语言推理等关键任务上,DeepSeek R1的性能均能与OpenAI o1正式版平分秋色,展示了其强大的实力。为了回馈开源社区,DeepSeek同时开源了DeepSeek-R1和De
近日,DeepSeek 宣布推出其首个通过强化学习 (RL) 训练的推理模型 DeepSeek-R1,该模型在多个推理基准测试中取得了与 OpenAI-o1-1217相当的性能。 DeepSeek-R1基于 DeepSeek-V3-Base 模型,并采用了多阶段训练和冷启动数据来提高推理能力。DeepSeek 的研究人员首先开发了 DeepSeek-R1-Zero,这是一个完全通过大规模强化学习训练的模型,没有任何监督微调的预备步骤。DeepSeek-R1-Zero 在推理基准测试中展现出卓越的性能,例如在 AIME2024考试中,其 pass@1分数从15.6% 提升至71.0%。然而,DeepSeek-R1-Zero 也存在一些问题
OpenAI 宣布推出其首个专注于生物数据的人工智能模型 ——GPT-4b micro,旨在帮助人类延长寿命,目标是让人类多活10年。根据 MIT 科技评论的报道,这一模型不仅为生物医学研究提供了新的视角,还可能引领意想不到的科学发现。OpenAI 与 Retro Biosciences 达成合作,后者成立于2022年,专注于开发抵抗细胞衰老的新药。该公司联合创始人丁胜教授曾在清华大学药学院担任院长,其团队在2022年取得了一项突破性成果,成功利用化学小分子诱导小鼠全能干细胞的稳定培养,这一成果还登上了著名期刊