DeepSeekがアップデート！DeepSeek V2.5チャットモデルのコード生成能力が飛躍的に向上、性能が全面的に向上

AIbase基地

公開日AIニュース · 1 分で読めます · Sep 6, 2024

835

AI分野において、DeepSeekの最新バージョンであるDeepSeek-V2.5は、その卓越したコード記述能力とチャットモデルのパフォーマンスにより、技術最前線における地位を改めて証明しました。GPT-4との激しい競争において、DeepSeek-V2.5は複数のテストセットで著しい勝率向上を示しました。

ArenaHardテストでは、勝率が68.3％から76.3％に上昇し、AlpacaEval2.0LCテストでは、46.61％から50.52％に上昇しました。これらの成果は、DeepSeek-V2.5が複雑な問題を理解し、解決策を提供する能力を示しているだけでなく、日本語と英語の環境における適応性と正確性を反映しています。

勝率の向上に加えて、DeepSeek-V2.5は他の評価指標でも進歩が見られました。MT-Benchスコアは8.84から9.02に、AlignBenchスコアは7.88から8.04に上昇しました。これらのスコアの向上は、DeepSeek-V2.5のライティングタスク、指示への従順性、不適切なリクエストの拒否能力が最適化されたことをさらに証明しています。

コード生成能力に関しては、DeepSeek-V2.5はDeepSeek-Coder-V2-0724を強化し、標準テストセットで目覚ましい成果を収めました。HumanEvalのスコアは89％に達し、LiveCodeBench（1～9月）のスコアも41％に達しました。これらの成果は、DeepSeek-V2.5が高品質で実行可能なコードを生成する能力が大幅に向上したことを示しています。

DeepSeekチームは、ハードウェアとソフトウェア設計を統合して、パフォーマンスの最適化、コスト効率、省エネルギーを実現するFire-Flyer AI-HPCという統合フレームワークも開発しました。Fire-Flyer2のパフォーマンスレベルは業界をリードするNVIDIA DGX-A100と同等ですが、コストは50％削減され、消費電力は40％削減されました。これらの成果は、システムのハードウェアとソフトウェアコンポーネントを最適化する慎重なエンジニアリング設計と熟考された設計決定によるものです。

体験アドレス:https://top.aibase.com/tool/deepseek-chat

ハードウェア開発せず！Anthropic CPO、企業向け汎用基盤モデル開発に注力と発表

先日開催されたHuman[X]カンファレンスにおいて、AIスタートアップAnthropicの最高製品責任者マイク・クリーガー(Mike Krieger)氏は、同社がハードウェアやコンシューマーエンターテイメント分野に進出する計画はないと明かし、企業向けの汎用基盤モデル開発に注力していくと発表しました。Claude AIの開発者であるAnthropicは、アマゾンとグーグルから支援を受けており、様々な業界に実用的なAIソリューションを提供することを目指しています。クリーガー氏によると、Ant…

マイクロソフト、南アフリカに人工知能インフラ構築のため2億9800万ドル投資

テクノロジー大手マイクロソフトは先日、人工知能とデータセンターのインフラ整備のために南アフリカに2億9800万ドルを投資すると発表しました。この取り組みは、南アフリカのデジタル経済発展を促進し、地元企業や個人により良い技術サポートとサービスを提供することを目的としています。世界的な人工知能需要の高まりを受け、マイクロソフトの投資は南アフリカのこの分野における競争力強化に貢献するでしょう。マイクロソフトの投資計画には、資金投入だけでなく、技術導入と人材育成も含まれています。地元企業や教育機関との連携を通じて、マイクロソフトは南アフリカで…

報道：アリババ、2025年末までに全販売業者へのAIツール導入目指す

サウスチャイナ・モーニング・ポストの報道によると、アリババ国際卸売市場の社長である張闊氏は最近のインタビューで、アリババが人工知能（AI）技術の導入を推進しており、2025年末までに全販売業者へのAIツール導入を目指していると述べました。現在、約20万人の販売業者のうち、半数以上がアリババが提供するAIアプリケーションを毎週利用しています。これらのAIツールは2024年初頭に導入され、販売業者のマーケティング、製品管理、顧客とのやり取り、リスク管理を支援することを目的としています。これらの施策はアリババ...