En el Consumer Electronics Show (CES) de 2025, NVIDIA presentó la nueva plataforma Cosmos, diseñada para acelerar el desarrollo de sistemas de inteligencia artificial (IA) física, especialmente para vehículos autónomos y robots. La plataforma Cosmos integra un modelo fundamental del mundo generativo (WFM), un etiquetador de video, mecanismos de seguridad y un pipeline de procesamiento de datos acelerado. Estas funciones ayudan a los desarrolladores a crear y optimizar modelos de IA con una menor dependencia de datos del mundo real.

image.png

La plataforma Cosmos estará disponible bajo una licencia de modelo abierto en Hugging Face y en el catálogo de NVIDIA NGC. Posteriormente, se lanzarán los microservicios optimizados de NVIDIA NIM, y se ofrecerá soporte empresarial a través de la plataforma de software empresarial NVIDIA AI.

Jensen Huang, CEO de NVIDIA, declaró en la feria: "La robótica está a punto de experimentar un momento de inflexión similar al de ChatGPT. Al igual que los grandes modelos de lenguaje, los modelos fundamentales del mundo son el núcleo del desarrollo de robots y vehículos autónomos, pero no todos los desarrolladores tienen la capacidad y los recursos para entrenar sus propios modelos. Creamos Cosmos para que el desarrollo de IA física sea más accesible y para que todos los desarrolladores puedan acceder a la robótica generalizada."

El modelo Cosmos puede generar videos de alta definición basados en la física a partir de texto, imágenes y datos de sensores, lo que lo hace adecuado para aplicaciones como búsqueda de videos, generación de datos sintéticos y aprendizaje por refuerzo. Los desarrolladores pueden personalizar el modelo para simular entornos industriales, escenarios de conducción y otros casos de uso específicos. Además, NVIDIA también presentó NeMo Curator, un pipeline de procesamiento de video acelerado capaz de procesar 20 millones de horas de datos de video en 14 días, y Cosmos Tokeniser, una herramienta de compresión de datos visuales.

Pras Velagapudi, director de tecnología de Agility Robotics, señaló: "La escasez y la variabilidad de los datos son desafíos clave para el aprendizaje exitoso en entornos robóticos. La capacidad de texto, imagen y video a mundo de Cosmos nos permite generar y mejorar escenarios para diversas tareas, lo que permite entrenar modelos sin necesidad de una costosa captura de datos reales excesiva."

Varias empresas importantes de robótica y transporte, incluyendo Agile Robots, XPENG, Waabi y Uber, ya han comenzado a utilizar Cosmos para el desarrollo de IA. Dara Khosrowshahi, CEO de Uber, declaró: "La IA generativa impulsará el futuro del transporte, requiriendo tanto datos abundantes como una potente capacidad de computación. Gracias a nuestra colaboración con NVIDIA, confiamos en poder acelerar el desarrollo de soluciones de conducción autónoma seguras y escalables."

Además de Cosmos, NVIDIA también presentó los grandes modelos de lenguaje Llama Nemotron y Cosmos Nemotron, un modelo de lenguaje visual, desarrollados específicamente para uso empresarial en sectores como la sanidad, las finanzas y la fabricación.

Blog oficial: https://nvidianews.nvidia.com/news/nvidia-launches-cosmos-world-foundation-model-platform-to-accelerate-physical-ai-development

Puntos clave:

🌍 La plataforma Cosmos está diseñada para acelerar el desarrollo de vehículos autónomos y robots, reduciendo la dependencia de datos reales.

🚀 Los desarrolladores pueden personalizar el modelo según sus necesidades, generando datos de video para diversas aplicaciones.

🤖 Varias empresas de robótica y transporte ya están utilizando Cosmos para acelerar la aplicación práctica de la IA.