DeepSeekオープンソースウィーク第3日目：DeepGEMMリリース、FP8 GEMMライブラリがAIトレーニングと推論を支援

AIbase基地

公開日AIニュース · 1 分で読めます · Feb 26, 2025

中国の人工知能企業DeepSeekは、「オープンソースウィーク」3日目に、FP8汎用行列乗算（GEMM）をサポートするオープンソースライブラリDeepGEMMを発表しました。このツールは、密集型および混合専門家（MoE）行列演算向けに設計されており、DeepSeek V3およびR1モデルのトレーニングと推論を強力にサポートします。公式発表はXプラットフォームを通じて行われ、技術コミュニティで大きな反響を呼びました。

DeepSeek公式アカウントの投稿によると、DeepGEMMはNVIDIA Hopper GPU上で最大1350 TFLOPSを超えるFP8計算性能を実現します。そのコアロジックはわずか約300行のコードですが、ほとんどの行列サイズで専門家が調整したカーネルを上回り、高い効率性と簡潔性を示しています。このライブラリは複雑な依存関係を必要とせず、Just-In-Time（JIT）コンパイル技術を採用し、密集型レイアウトと2種類のMoEレイアウトをサポートしています。「チュートリアルのように分かりやすい」設計で、開発者にとって学習と使用が容易です。

Xユーザーの@TechBitDailyは、「DeepGEMMの発表はDeepSeekオープンソースウィークのハイライトであり、そのFP8性能と簡潔な設計は印象的です」とコメントしています。別のユーザー@AIObserverCNは、このライブラリがMoEモデルの効率的なトレーニングをサポートする上で顕著な利点があり、Hopperアーキテクチャ上でのAIコミュニティのさらなるイノベーションを促進する可能性があると指摘しています。

オープンソースウィークの一環として、DeepGEMMの発表は、DeepSeekがAI技術の透明性とコミュニティ協力を推進するというコミットメントを継続したものです。これ以前、同社は最初の2日間で、高速言語モデルアーキテクチャと専門家並列通信に焦点を当てたFlashMLAとDeepEPツールを発表しました。今回のDeepGEMMの発表は、AIインフラストラクチャ構築における同社の技術力をさらに示すものです。業界関係者は、このライブラリがDeepSeek独自のモデルの性能向上に貢献するだけでなく、世界中の開発者にとって効率的で使いやすい行列演算ツールを提供し、将来の応用範囲が期待できると考えています。ユーザーは現在、GitHubからDeepGEMMを入手し、AIトレーニングと推論における可能性を探ることができます。

プロジェクトアドレス：https://github.com/deepseek-ai/DeepGEMM

大規模言語モデルの効率を1.7倍に向上：バイトダンスのCOMET技術がオープンソース化

バイトダンス傘下の豆包大規模言語モデルチームは先日、混合専門家モデル（MoE）アーキテクチャにおける主要なボトルネックを克服し、COMETという名称の重要な最適化技術をオープンソース化したと発表しました。この技術は、大規模言語モデルのトレーニング効率を大幅に向上させ、最大1.7倍の効率向上を実現し、トレーニングコストを40％削減することに成功しました。画像注記：画像はAIによって生成され、画像ライセンス提供サービスMidjourneyを使用しています。COMET技術は、バイトダンスの万規模GPUクラスタトレーニングで実際に適用されており、数百万GPU時間の節約に貢献しています。

DeepSeek オープンソースウィーク2日目：MoEモデル向け初のオープンソースEP通信ライブラリ

Deepseekはオープンソースウィーク2日目の成果として、MoEモデル向けの初のオープンソースEP通信ライブラリを発表しました。混合専門家モデルのトレーニングと推論のフルスタック最適化を実現しています。DeepEPは、混合専門家（MoE）と専門家並列処理（EP）向けに設計された、高効率な通信ライブラリです。高スループットと低遅延の多対多GPUカーネル（一般的にMoEスケジューリングと組み合わせと呼ばれます）を提供することに重点を置いています。DeepEPは、FP8などの低精度演算をサポートするだけでなく、DeepSeek-V3論文とも連携しています。

Google、新たなビジョン言語モデル PaliGemma 2 Mix を発表、開発者を支援する多機能モデル

先日、Googleは、PaliGemma2Mix と名付けられた、新たなビジョン言語モデル（VLM）を発表しました。このモデルは画像処理と自然言語処理の能力を融合し、視覚情報とテキスト入力の両方を理解し、必要に応じて対応する出力を生成することができます。これは、人工知能技術におけるマルチタスク処理の更なる進歩を示しています。PaliGemma2Mix は非常に強力な機能を備えており、画像記述、光学文字認識（OCR）などを統合しています。

AIニュース

DeepSeekオープンソースウィーク第3日目：DeepGEMMリリース、FP8 GEMMライブラリがAIトレーニングと推論を支援

AIbase基地

関連AIニュースの推奨

テンセント、Hunyuan-TurboSを発表：初の超大型混合Transformer-Mamba MoEモデルが登場

大規模言語モデルの効率を1.7倍に向上：バイトダンスのCOMET技術がオープンソース化

DeepSeek オープンソースウィーク2日目：MoEモデル向け初のオープンソースEP通信ライブラリ

Google、新たなビジョン言語モデル PaliGemma 2 Mix を発表、開発者を支援する多機能モデル