备受期待的Deepseek V3终于开源!这款全新的AI模型在多语言编程能力上取得了重大突破,其在aider多语言编程测评中的表现,甚至超越了Claude3.5Sonnet V2等竞争对手,引发了业界广泛关注。
据了解,Deepseek V3相比之前的版本,在性能上实现了质的飞跃。Deepseek V2.5在aider测评中的成功率仅为17%,而V3则暴增至48%,这充分展现了其强大的进步。
Deepseek V3采用了高达6850亿参数的混合专家(MoE)架构。该架构包含256个专家,并使用sigmoid路由方式,每次选取前8个专家(topk=8)参与计算,这种设计使得模型能够更加高效地处理复杂任务,并提高了性能。
Deepseek V3的开源,无疑将为AI社区带来新的活力。其强大的编程能力有望在软件开发、自动化等领域发挥重要作用,为各行各业的智能化升级注入新的动力。
地址:https://huggingface.co/deepseek-ai/DeepSeek-V3-Base/tree/main