DeepSeek又更新！DeepSeek V2.5聊天模型代码能力飞跃，性能全面提升

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年9月6号 9:02

881

在人工智能领域，DeepSeek的最新版本DeepSeek-V2.5以其卓越的代码编写能力和聊天模型性能，再次证明了其在技术前沿的地位。在与GPT-4的激烈对决中，DeepSeek-V2.5在多个测试集上展现了显著的胜率提升。

在ArenaHard测试中，其胜率从68.3%跃升至76.3%，而在AlpacaEval2.0LC测试中，胜率也从46.61%提升至50.52%。这些成绩不仅展示了DeepSeek-V2.5在理解复杂问题和提供解决方案方面的能力，也反映了其在中英文环境下的适应性和准确性。

除了在胜率上的提升，DeepSeek-V2.5在其他评分指标上也有所进步。MT-Bench分数从8.84提高到9.02，AlignBench分数也从7.88提升至8.04。这些分数的增长，进一步证明了DeepSeek-V2.5在写作任务、指令遵循和拒绝不当请求方面的能力得到了优化。

在代码生成能力方面，DeepSeek-V2.5在DeepSeek-Coder-V2-0724的基础上进行了加强，并在标准测试集上取得了令人瞩目的成绩。HumanEval的评分达到了89%，而LiveCodeBench（1-9月）的评分也达到了41%。这些成绩表明，DeepSeek-V2.5在生成高质量、可执行代码方面的能力得到了显著提升。

DeepSeek团队还开发了一个名为Fire-Flyer AI-HPC的综合框架，该框架将硬件和软件设计协同融合，以实现性能优化、成本效益和节能。Fire-Flyer2的性能水平与业界领先的NVIDIA DGX-A100相当，而成本降低了50%，能耗降低了40%。这些成果得益于精心的工程设计和深思熟虑的设计决策，这些决策优化了系统的硬件和软件组件。

体验地址:https://top.aibase.com/tool/deepseek-chat

Manus正式推出付费计划，Manus Starter套餐定价39美元/月

在人工智能服务日益competitive的背景下，Manus近日宣布推出其首个付费订阅模式，标志着该平台从免费测试阶段向商业化运营的重要转型。公司推出了两个不同级别的订阅计划:Starter和Pro，同时保留了1，000积分的免费额度，为不同需求的用户提供了灵活选择。Manus Starter套餐定价39美元/月，提供3，900月度积分，允许同时运行两个任务，并赋予用户专属资源、扩展上下文长度以及高峰时段优先访问的权限。而Pro套餐则以199美元/月的价格，为用户提供19，900月度积分，支持同时运行五个任务，并

人工智能安全与应用迎来新规范，市场监管总局加快标准研制

在今天的例行发布会上，市场监管总局宣布，将加快推进人工智能（AI）领域国家标准的研制工作。这一举措旨在引领行业发展方向，优化技术应用，提升产业生态，推动AI技术的高效、可靠应用。首先，市场监管总局将重点关注算力平台的标准建设。计划加快推动深度学习编译器、高质量数据集以及计算调度与协同等关键技术标准的制定。通过优化AI数据服务和计算资源整合，提升人工智能领域的资源利用效率。图源备注：图片由AI生成，图片授权服务商Midjourney在大模型技术领域，将加速

Hakimo 获得 1050 万美元融资，致力于用人工智能重塑物理安全

随着犯罪率的上升，安保团队人手不足以及传统系统带来的误报，企业对于更智能、更可靠的保护需求日益迫切。为了满足这一需求，总部位于加州门罗公园的人工智能安保初创公司 Hakimo 近日宣布完成1050万美元的 A 轮融资，以推动其通过自主、人工智能驱动的监控系统来改造物理安全的使命。此次融资由 Vertex Ventures 和 Zigg Capital 主导，此外，RXR Arden Digital Ventures、Defy.vc 以及 Gokul Rajaram 等也给予了支持。本轮融资后，Hakimo 的总融资额已达到2050万美元。Hakimo 推出了一种首创的 AI 操作员，

ChatGPT 新图像生成功能火爆，OpenAI 因算力不足限制访问速度

近日，OpenAI 在其 ChatGPT 平台上推出了全新升级的图像生成功能，吸引了大量用户的关注与使用。然而，这一火爆的功能也让 OpenAI 面临了一些新挑战。OpenAI 的创始人 Sam Altman 透露，由于需求激增，公司的 GPU 算力几乎不堪重负，他形象地表示 “GPU 冒烟了”，这迫使他们在一定程度上对图像生成功能引入速率限制。新功能 “Images in ChatGPT” 是基于 GPT-4o 模型开发的，用户可以通过简单的自然语言指令生成和编辑图片，并进行多轮迭代优化。这一功能的推出，标志着 ChatGPT 在文本、图像、代

AI新闻资讯