2025年のコンシューマー・エレクトロニクス・ショー(CES)で、NVIDIAは物理AIシステム、特に自動運転車やロボットの開発を加速させることを目的とした新しいCosmosプラットフォームを発表しました。Cosmosプラットフォームは、ジェネレーティブワールドファウンデーションモデル(WFM)、ビデオラベラー、セキュリティ保護メカニズム、そして高速データ処理パイプラインを統合しており、開発者は現実世界のデータへの依存を減らしながらAIモデルを作成および最適化できます。
Cosmosプラットフォームは、オープンモデルライセンスの下、Hugging FaceとNVIDIA NGCカタログで提供され、最適化されたNVIDIA NIMマイクロサービスが後日リリースされ、NVIDIA AI Enterpriseソフトウェアプラットフォームを通じてエンタープライズサポートを提供します。
NVIDIAのCEOであるジェンスン・フアン氏は、同ショーで次のように述べています。「ロボット工学は、ChatGPTのような転換期を迎えています。大規模言語モデルと同様に、ワールドファウンデーションモデルはロボットと自動運転車の発展の中核ですが、すべての開発者が独自のモデルをトレーニングする能力とリソースを持っているわけではありません。Cosmosを作成したのは、物理AIの開発をより普及させ、すべての開発者が汎用ロボット技術に触れられるようにするためです。」
Cosmosモデルは、テキスト、画像、センサーデータに基づいて物理的に正確な高解像度ビデオを生成できるため、ビデオ検索、合成データ生成、強化学習などの用途に適しています。開発者は、産業環境、運転シーン、その他の特定のユースケースをシミュレートするためにモデルをカスタマイズできます。さらに、NVIDIAは、2000万時間のビデオデータを14日以内に処理できる高速ビデオ処理パイプラインであるNeMo Curatorと、視覚データ圧縮ツールであるCosmos Tokeniserも発表しました。
Agility RoboticsのCTOであるPras Velagapudi氏は次のように述べています。「データの不足とばらつきは、ロボット環境での成功した学習における重要な課題です。Cosmosのテキスト、画像、ビデオから世界への機能により、さまざまなタスクのシナリオを生成および拡張できるため、高価な現実世界のデータ取得を必要とせずにモデルをトレーニングできます。」
Agile Robots、XPENG、Waabi、Uberなど、主要なロボットおよび輸送企業が、AI開発にCosmosを採用し始めています。UberのCEOであるダラ・コスロシャヒ氏は次のように述べています。「ジェネレーティブAIは未来の移動を推進しますが、豊富なデータと強力な計算能力の両方が必要です。NVIDIAとの連携により、安全で拡張性の高い自動運転ソリューションの開発を加速できると確信しています。」
Cosmosに加えて、NVIDIAは、医療、金融、製造などの業界の企業向けに開発されたLlama Nemotron大規模言語モデルとCosmos Nemotronビジョン言語モデルも発表しました。
公式ブログ:https://nvidianews.nvidia.com/news/nvidia-launches-cosmos-world-foundation-model-platform-to-accelerate-physical-ai-development
要点:
🌍 Cosmosプラットフォームは、自動運転車とロボットの開発を加速し、現実世界のデータへの依存を削減することを目的としています。
🚀 開発者は、必要に応じてモデルをカスタマイズし、さまざまなアプリケーションシナリオのビデオデータを作成できます。
🤖 多くのロボットおよび輸送企業がCosmosを使用し始め、AI技術の実際の応用を加速しています。