この度、DeepSeek社が開発したDeepSeek-R1、V3、Coderを含む全シリーズの大規模言語モデルが、国家超算互联网平台(www.scnet.cn)に正式に導入されました。国産の高度な統合計算能力と全国一体化の計算力サービス体系の支援を受け、中国のAI大規模言語モデル産業は重要な一歩を踏み出しました。
国家超算互联网平台では現在、DeepSeek-R1モデルの1.5B、7B、8B、14Bバージョンが公開されており、ユーザーはQRコードまたはウェブインターフェースから直接オンライン推論サービスを利用できます。ローカルでの展開は不要です。企業向けには、独自のデータを取り込んでプライベートなモデルをカスタマイズ開発できるサポートを提供しており、32B、70Bなど、より大きなパラメータを持つバージョンも近日中に順次公開予定です。同時に、DeepSeek-V3、Coderシリーズ、Mathシリーズ(7B)などの垂直領域モデルも公開され、コード生成、数学的推論など、多様なシナリオに対応しています。
海外の大規模言語モデルと比較して、DeepSeekシリーズはアルゴリズムの最適化により計算資源の消費を大幅に削減し、国家超算平台の「使いやすく、多様な機能を持つ」計算力スケジューリング能力と組み合わせることで、呼び出しコストの大幅な削減を実現しています。DeepSeek-R1-Distill-Qwen-7Bを例にとると、そのWebUI対話インターフェースは初心者でも簡単に利用でき、企業ユーザーはAPIインターフェースを介して迅速に本番環境に統合し、モデルの呼び出しからプライベートな展開までの完全なワークフローを構築できます。
アナリストは、DeepSeekモデルが超算プラットフォームで本格的に導入されることで、国内AI業界における海外のクローズドソースモデルへの依存が変わる可能性があると指摘しています。国産の計算力基盤に基づいて、より多くの開発者がローカル化されたモデルのトレーニングと最適化を行うことで、中国はAI技術の応用層において大量の「追い越し」を実現する可能性があります。「神秘的な東洋の力」によって推進されるこの探求の波は、世界のAI競争に新たな変数を注入しつつあります。