3月18日開催されたGTCカンファレンスで、NvidiaのCEOであるジェンスン・フアンは、新しく発表されたソフトウェアDynamoによって、DeepSeekの人工知能処理速度を30倍に向上させるという画期的な計画を発表しました。これは、DeepSeek社のAIプログラムR1が市場に波乱を巻き起こしたことに対するNvidiaの対応です。DeepSeekの技術は、クエリごとに必要な計算量を大幅に削減できるため、Nvidiaの将来の見通しに対して投資家の懸念が高まっていました。
NvidiaのDynamoソフトウェアは、AI推論タスクを最大1000個のGPUに分散して並列処理することで、クエリのスループットを大幅に向上させます。フアンCEOによると、新しいBlackwellチップを使用することで、Dynamoは同じアーキテクチャで30倍の処理能力を提供できるとのことです。この能力の向上により、AIデータセンターは毎秒より多くのトークンを処理できるようになり、全体的な収益の向上につながります。
具体的には、Dynamoソフトウェアは、100万トークンあたり1ドルの価格で、毎秒の処理量を向上させます。これは、サービスプロバイダーがより多くの顧客のクエリを同時に処理するか、単一ユーザーに対してより強力なサービスを提供してより高い料金を請求することを選択できることを意味します。Nvidiaはこの高性能なAIサービスを「AIファクトリー」と呼んでいます。
DeepSeekのパフォーマンスをさらに向上させるために、NvidiaはHuggingFace上で調整済みのDeepSeek R1バージョンも公開しました。このバージョンは、計算ビット数(「FP4」)を削減することで、モデルの精度を大幅に低下させることなく、パフォーマンスを大幅に向上させています。
Dynamoに加えて、Nvidiaは最新バージョンのBlackwellチップ「Ultra」を発表し、メモリ容量と全体的なパフォーマンスを向上させました。さらに、NvidiaはAI開発者向けの小規模な個人用コンピューターDGX Sparkを正式に発表し、DGX Stationデスクトップコンピューターの構成も更新しました。
今回のカンファレンスでは、改良されたネットワークスイッチや医療用ロボット向けのソフトウェアモデルなど、その他多くの新製品や協力プロジェクトも発表され、NvidiaのAIとコンピューティング分野における継続的なイノベーション能力を示しました。
要点:
🌟 NvidiaがDynamoソフトウェアを発表、DeepSeek AIの処理速度を30倍に向上。
💰 Dynamoにより、サービスプロバイダーは顧客クエリをより効率的に処理し、収益を向上。
🖥️ 新しいBlackwellチップ「Ultra」とDGX Sparkコンピューターも発表。