近日,人工智能领域迎来重大突破,AI公司深度求索(Deepseek)推出的Coder v2模型在多项测试中表现卓越,一举超越谷歌的Gemini模型,成为开源人工智能领域的新王者。根据Livebench AI(业内公认的最难以操纵的基准测试平台)的评估结果,深度求索Coder v2模型仅次于OpenAI和Anthropic的商业模型,跃居开源模型的第三位。这一成绩标志着开源人工智能技术正在快速追赶商业巨头。

image.png

Deepseek Coder v2在编程和推理能力方面表现尤为出色。值得一提的是,该模型在数学领域的表现甚至超越了所有GPT-4变体。尽管在语言技能方面略显逊色,但其在其他维度的优秀表现足以弥补这一短板。

与此同时,谷歌最新推出的Gemini大语言模型(LLM)虽然在人工评估排行榜上表现不俗,但被认为并非真正优秀的模型。相比之下,DeepseekCoder v2在实际生产用例中的表现更为出色。

业内专家预测,如果OpenAI和Anthropic将重心转向辅助功能而非核心AI技术,开源模型很有可能在年底前登顶。这一趋势表明,开源人工智能正在迅速缩小与商业巨头之间的差距,未来发展潜力巨大。

DeepseekCoder v2的崛起不仅展示了开源社区的创新能力,也为人工智能的民主化和多样化发展注入了新的活力。随着技术的不断进步,我们有理由期待更多突破性的开源AI模型问世,推动整个行业向前发展。