イーロン・マスクは最近、ソーシャルメディアで動画を公開し、テスラがオースティン本社で建設中のCortex AIスーパーコンピューター群の内装を紹介しました。名称変更されたこのスーパーコンピューター群は、テスラ「Giga Texas」工場の一部であり、稼働開始時には130メガワットの冷却と電力が必要とされ、2026年には500メガワットに増加すると予想されています。

Cortexスーパーコンピューター群の建設規模は衝撃的で、7万台のAIサーバーが設置される予定です。マスク氏の動画では、大量のサーバーラックが組み立てられている様子が映っており、各列に16台のラック、各ラックに8台のサーバーが収容されています。動画には約16~20列のラックが見え、約2000台のGPUサーバーがあるものと推定されますが、これは予想される最終規模の3%にも満たない数です。

QQ20240829-135706.png

テスラの7月の決算説明会で、マスク氏はCortexスーパーコンピューター群に「Nvidia H100 GPU 5万台に加え、自社開発ハードウェア2万台」が搭載されると明らかにしました。これは以前の発言よりも少ない数で、以前はCortexに5万台のテスラDojo AIハードウェアユニットを搭載すると推定していました。テスラ独自のハードウェアは後日導入される予定で、Cortexは稼働開始時にはNvidiaのハードウェアに完全に依存することになります。

Cortexスーパーコンピューター群の建設目的は「現実世界のAI問題を解決すること」です。テスラの2024年第2四半期決算説明会では、これにはテスラの完全自動運転(FSD)システムのトレーニングが含まれており、これは消費者向けテスラ車と今後発売される「サイバータクシー」製品を支え、またOptimusロボットのAIトレーニングにも利用されます。Optimusは2025年に限定生産開始予定の自律型ヒューマノイドロボットで、テスラの製造工程で使用される予定です。

Cortexスーパーコンピューター群の冷却システムも注目に値します。マスク氏は6月に建設中の巨大なファンシステムを紹介しており、このシステムがスーパーコンピューター群全体を冷却します。このファンスタックは、Supermicroが提供する液体冷却ソリューションを冷却し、最終的には500メガワットの冷却と電力を処理するように設計されています。

Cortexスーパーコンピューター群は、マスク氏が開発中のスーパーコンピューター群に加わります。現在、マスク氏のデータセンターで最初に稼働しているのはメンフィススーパーコンピューター群で、xAIが所有し、10万台のNvidia H100 GPUで駆動されています。メンフィスの全10万台のサーバーは単一のRDMA(Remote Direct Memory Access)ネットワークで接続され、同様にSupermicroの協力を得て冷却されています。