昨日、小鵬汽車は香港でAI技術説明会を開催し、開発中の720億パラメーター超大規模自動運転大規模言語モデル「小鵬世界基座モデル」を初めて公開しました。このモデルは、マルチモーダルアーキテクチャを中核とし、視覚理解、連鎖推論、動作生成能力を融合させており、クラウド蒸留技術を通じて車載システムに展開し、AIロボットや空飛ぶ車などのエコシステム製品にも同時に対応することを目指しています。
小鵬汽車の自動運転責任者である李力耘氏によると、基盤モデルは大規模言語モデルをバックボーンとし、膨大な運転データを活用してトレーニングされており、自己進化能力を備えています。強化学習メカニズムを通じて、モデルは継続的に意思決定効率を向上させ、人間の運転能力を上回る自動運転技術の実現を目指しています。この開発を支えるため、小鵬汽車は2023年からAIインフラストラクチャの構築を加速しており、国内自動車業界初の1万枚のGPUを備えた巨大な計算能力を持つクラスタを構築しました。その計算能力は10EFLOPSに達し、クラスタの利用率は90%以上を維持しており、ピーク時の効率は98%を超えています。
小鵬汽車はこのクラウドから車載システムへの展開に至る一連のプロセスを「クラウドモデルファクトリー」と名付け、事前学習、事後学習、モデル蒸留、車載システムへの適合など、各段階を含んでいます。現在、このファクトリーは平均5日に1回のペースで全工程の反復処理を実現しており、ビデオトレーニングデータ量は2000万クリップから、今年の目標である2億クリップに増加しました。開発チームはまた、さまざまなサイズの基盤モデルを開発しており、720億パラメーターの72Bモデルは、主流のVLAモデルの35倍のパラメーター数を誇り、小鵬汽車が自動運転の計算能力において画期的な進歩を遂げたことを示しています。
技術的なアプローチにおいて、小鵬汽車は「クラウドモデルファクトリー」を通じてデータの閉ループを実現しています。基盤モデルはクラウドで事前学習と強化学習を行い、蒸留によって軽量化されたバージョンに圧縮され、最終的に車載システムに展開されます。このアーキテクチャは、既存車種のインテリジェント化アップグレードをサポートするだけでなく、AIロボットや空飛ぶ車などの最先端製品にも基盤となる能力を提供します。
公式発表によると、小鵬汽車は2024年からAIインフラストラクチャ(AI Infra)の構築を開始し、データ収集からモデルトレーニング、シナリオへの展開までを網羅する包括的なシステムを構築しました。3つの段階的な成果がすでに明らかになっています。それは、自動運転分野における規模の法則の継続的な有効性の検証、後付けの車載計算能力による基盤モデルによる車両制御の実現、72Bパラメーターモデルのトレーニング開始と強化学習専用フレームワークの構築です。将来、「小鵬世界基座モデル」はAIエコシステムに深く統合され、スマートカーとロボット技術の協調進化を推進していきます。