Auf der Consumer Electronics Show (CES) 2025 stellte NVIDIA die neue Cosmos-Plattform vor. Diese Plattform soll die Entwicklung von physischen KI-Systemen, insbesondere für autonome Fahrzeuge und Roboter, beschleunigen. Cosmos integriert ein generatives World Foundation Model (WFM), einen Video-Markierer, Sicherheitsmechanismen und eine beschleunigte Datenverarbeitungs-Pipeline. Diese Funktionen helfen Entwicklern, KI-Modelle zu erstellen und zu optimieren, wobei die Abhängigkeit von realen Daten reduziert wird.

image.png

Die Cosmos-Plattform wird unter einer Open-Model-Lizenz auf Hugging Face und im NVIDIA NGC Katalog verfügbar sein. Später folgen optimierte NVIDIA NIM-Microservices und Unternehmenssupport über die NVIDIA AI Enterprise-Softwareplattform.

NVIDIA CEO Jensen Huang erklärte auf der Messe: „Die Robotik steht kurz vor einem Wendepunkt, ähnlich wie ChatGPT. Wie große Sprachmodelle sind World Foundation Models der Schlüssel für die Entwicklung von Robotern und autonomen Fahrzeugen. Aber nicht alle Entwickler haben die Fähigkeiten und Ressourcen, um eigene Modelle zu trainieren. Wir haben Cosmos geschaffen, um die Entwicklung physischer KI zu demokratisieren und jedem Entwickler Zugang zu universeller Robotertechnologie zu ermöglichen.“

Das Cosmos-Modell kann basierend auf Text-, Bild- und Sensordaten physikalisch realistische HD-Videos generieren. Dies eignet sich für Anwendungen wie Videosuche, synthetische Datengenerierung und Reinforcement Learning. Entwickler können das Modell anpassen, um industrielle Umgebungen, Fahrszenarien und andere spezifische Anwendungsfälle zu simulieren. Zusätzlich stellte NVIDIA NeMo Curator vor, eine beschleunigte Videoverarbeitungspipeline, die innerhalb von 14 Tagen 20 Millionen Stunden Videodaten verarbeiten kann, sowie Cosmos Tokeniser, ein Werkzeug zur Komprimierung visueller Daten.

Pras Velagapudi, CTO von Agility Robotics, bemerkte: „Datenknappheit und -variabilität sind zentrale Herausforderungen für erfolgreiches Lernen in Roboterumgebungen. Die Text-, Bild- und Video-zu-Welt-Fähigkeiten von Cosmos ermöglichen es uns, Szenarien für verschiedene Aufgaben zu generieren und zu erweitern, wodurch das Training von Modellen ohne den Bedarf an umfangreicher und teurer Erfassung realer Daten möglich wird.“

Mehrere große Robotik- und Transportunternehmen, darunter Agile Robots, XPENG, Waabi und Uber, setzen Cosmos bereits für die KI-Entwicklung ein. Uber CEO Dara Khosrowshahi sagte: „Generative KI wird die Mobilität der Zukunft antreiben und benötigt sowohl umfangreiche Daten als auch leistungsstarke Rechenleistung. Durch die Zusammenarbeit mit NVIDIA sind wir zuversichtlich, die Entwicklung sicherer und skalierbarer Lösungen für autonomes Fahren zu beschleunigen.“

Neben Cosmos stellte NVIDIA auch die großen Sprachmodelle Llama Nemotron und Cosmos Nemotron vor, die speziell für Unternehmen in Branchen wie Medizin, Finanzen und Fertigung entwickelt wurden.

Offizieller Blog: https://nvidianews.nvidia.com/news/nvidia-launches-cosmos-world-foundation-model-platform-to-accelerate-physical-ai-development

Wichtigste Punkte:

🌍 Die Cosmos-Plattform soll die Entwicklung autonomer Fahrzeuge und Roboter beschleunigen und die Abhängigkeit von realen Daten reduzieren.

🚀 Entwickler können das Modell nach Bedarf anpassen und Videodaten für verschiedene Anwendungsfälle generieren.

🤖 Mehrere Robotik- und Transportunternehmen nutzen bereits Cosmos, um die praktische Anwendung von KI-Technologien zu beschleunigen.