DeepSeekは、知乎で公式アカウントを開設し、「DeepSeek-V3/R1推論システム概要」という技術記事を発表しました。この記事では、同社のモデル推論システムの最適化の詳細とコスト利益率の情報が初めて詳細に公開され、注目を集めていた「DeepSeekオープンソースウィーク」が正式に終了しました。
記事では、DeepSeek-V3/R1推論システムの2つの主要な最適化目標である「スループットの向上」と「レイテンシの低減」について説明しています。これらの目標を達成するために、DeepSeekは大規模なノード間エキスパート並列処理(EP)技術を採用しました。これはシステムの複雑性を増すものの、記事ではEP技術を活用してバッチサイズを増やし、転送時間を短縮し、負荷分散を実現する方法を重点的に説明しています。
特に注目すべきは、DeepSeekがコストと利益率のデータを公開したことです。記事によると、「GPUレンタルコストを1時間あたり2ドルと仮定すると、総コストは1日あたり87,072ドルになります。すべてのトークンをDeepSeek R1の価格で計算した場合、理論上1日の総収益は562,027ドルとなり、コスト利益率は545%になります。」と発表しています。