Na Consumer Electronics Show (CES) de 2025, a NVIDIA lançou a nova plataforma Cosmos, projetada para acelerar o desenvolvimento de sistemas de Inteligência Artificial (IA) física, especialmente para veículos autônomos e robôs. A plataforma Cosmos integra um modelo fundamental de mundo generativo (WFM), um marcador de vídeo, mecanismos de segurança e um pipeline de processamento de dados acelerado, ajudando os desenvolvedores a criar e otimizar modelos de IA com menos dependência de dados do mundo real.
A plataforma Cosmos será disponibilizada sob licença de modelo aberto no Hugging Face e no catálogo NVIDIA NGC. Posteriormente, serão lançados microsserviços NVIDIA NIM otimizados e suporte empresarial por meio da plataforma de software NVIDIA AI Enterprise.
Jensen Huang, CEO da NVIDIA, disse na feira: “A robótica está prestes a ter um momento semelhante ao do ChatGPT. Assim como os grandes modelos de linguagem, os modelos fundamentais de mundo são o núcleo do desenvolvimento de robôs e veículos autônomos, mas nem todos os desenvolvedores têm a capacidade e os recursos para treinar seus próprios modelos. Criamos o Cosmos para tornar o desenvolvimento de IA física mais acessível, permitindo que cada desenvolvedor tenha acesso à robótica universal.”
O modelo Cosmos pode gerar vídeos em alta definição baseados em física a partir de texto, imagens e dados de sensores, tornando-o adequado para aplicações como busca de vídeo, geração de dados sintéticos e aprendizado por reforço. Os desenvolvedores podem personalizar o modelo para simular ambientes industriais, cenários de direção e outros casos de uso específicos. Além disso, a NVIDIA lançou o NeMo Curator, um pipeline de processamento de vídeo acelerado que pode processar 20 milhões de horas de dados de vídeo em 14 dias, e o Cosmos Tokeniser, uma ferramenta de compressão de dados visuais.
Pras Velagapudi, CTO da Agility Robotics, apontou: “A escassez e a variabilidade de dados são desafios-chave para o aprendizado bem-sucedido em ambientes robóticos. A capacidade de texto, imagem e vídeo para mundo do Cosmos permite-nos gerar e aumentar cenários para várias tarefas, permitindo o treino de modelos sem a necessidade de muita e cara captura de dados reais.”
Várias empresas importantes de robótica e transporte, incluindo Agile Robots, XPENG, Waabi e Uber, já começaram a adotar o Cosmos para o desenvolvimento de IA. Dara Khosrowshahi, CEO da Uber, disse: “A IA generativa impulsionará o futuro do transporte, exigindo tanto dados abundantes quanto capacidade de computação robusta. Por meio da parceria com a NVIDIA, temos confiança em acelerar o progresso de soluções autônomas seguras e escaláveis.”
Além do Cosmos, a NVIDIA também lançou o grande modelo de linguagem Llama Nemotron e o modelo de linguagem visual Cosmos Nemotron, desenvolvidos especificamente para uso empresarial em setores como saúde, finanças e manufatura.
Blog oficial: https://nvidianews.nvidia.com/news/nvidia-launches-cosmos-world-foundation-model-platform-to-accelerate-physical-ai-development
Destaques:
🌍 A plataforma Cosmos visa acelerar o desenvolvimento de veículos autônomos e robôs, reduzindo a dependência de dados reais.
🚀 Os desenvolvedores podem personalizar os modelos conforme necessário, gerando dados de vídeo para diversos cenários de aplicação.
🤖 Várias empresas de robótica e transporte já estão usando o Cosmos, acelerando a aplicação prática da tecnologia de IA.