Lors du Consumer Electronics Show (CES) 2025, NVIDIA a lancé la nouvelle plateforme Cosmos, conçue pour accélérer le développement de systèmes d'intelligence artificielle (IA) physique, notamment pour les véhicules autonomes et les robots. La plateforme Cosmos intègre un modèle de fondation mondial génératif (WFM), un outil de marquage vidéo, des mécanismes de sécurité et un pipeline de traitement de données accéléré. Ces fonctionnalités aident les développeurs à créer et optimiser des modèles d'IA en réduisant leur dépendance aux données du monde réel.
La plateforme Cosmos sera disponible sous licence de modèle ouvert sur Hugging Face et le catalogue NVIDIA NGC. Des microservices NVIDIA NIM optimisés seront lancés ultérieurement, et un support entreprise sera fourni via la plateforme logicielle NVIDIA AI Enterprise.
Jensen Huang, PDG de NVIDIA, a déclaré lors du salon : « La robotique est sur le point de connaître un tournant comparable à celui de ChatGPT. Comme les grands modèles de langage, les modèles de fondation mondiaux sont au cœur du développement des robots et des véhicules autonomes, mais tous les développeurs n'ont pas les capacités et les ressources nécessaires pour entraîner leurs propres modèles. Nous avons créé Cosmos pour démocratiser le développement de l'IA physique et rendre la robotique universelle accessible à tous les développeurs. »
Le modèle Cosmos peut générer des vidéos haute définition basées sur la physique à partir de texte, d'images et de données de capteurs, ce qui le rend adapté à des applications telles que la recherche vidéo, la génération de données synthétiques et l'apprentissage par renforcement. Les développeurs peuvent personnaliser le modèle pour simuler des environnements industriels, des scénarios de conduite et d'autres cas d'utilisation spécifiques. NVIDIA a également lancé NeMo Curator, un pipeline de traitement vidéo accéléré capable de traiter 20 millions d'heures de données vidéo en 14 jours, ainsi que Cosmos Tokeniser, un outil de compression de données visuelles.
Pras Velagapudi, directeur technique d'Agility Robotics, a souligné : « La rareté et la variabilité des données constituent des défis majeurs pour l'apprentissage réussi dans les environnements robotiques. La capacité de Cosmos à transformer du texte, des images et des vidéos en données du monde réel nous permet de générer et d'améliorer des scénarios pour diverses tâches, permettant ainsi d'entraîner des modèles sans avoir besoin d'une acquisition coûteuse de données réelles. »
Plusieurs grandes entreprises de robotique et de transport, notamment Agile Robots, XPENG, Waabi et Uber, ont déjà commencé à utiliser Cosmos pour le développement de l'IA. Dara Khosrowshahi, PDG d'Uber, a déclaré : « L'IA générative stimulera les déplacements de demain, nécessitant à la fois des données abondantes et une puissance de calcul importante. Grâce à notre collaboration avec NVIDIA, nous sommes convaincus de pouvoir contribuer à accélérer le développement de solutions de conduite autonome sûres et évolutives. »
Outre Cosmos, NVIDIA a également lancé les grands modèles de langage Llama Nemotron et Cosmos Nemotron, spécialement conçus pour une utilisation professionnelle dans les secteurs de la santé, de la finance et de la fabrication.
Blog officiel : https://nvidianews.nvidia.com/news/nvidia-launches-cosmos-world-foundation-model-platform-to-accelerate-physical-ai-development
Points clés :
🌍 La plateforme Cosmos vise à accélérer le développement de véhicules autonomes et de robots, en réduisant la dépendance aux données réelles.
🚀 Les développeurs peuvent personnaliser les modèles en fonction de leurs besoins et générer des données vidéo pour divers scénarios d'application.
🤖 Plusieurs entreprises de robotique et de transport utilisent déjà Cosmos pour accélérer l'application concrète des technologies d'IA.