A startup norueguesa, 1X Technologies, anunciou recentemente um avanço significativo no desenvolvimento de modelos de mundo baseados em inteligência artificial para robôs. Simplificando, esses modelos são como campos de testes virtuais para robôs, permitindo que eles sejam testados e aprimorados em várias situações, sem a necessidade de testes práticos no mundo real.

A 1X acredita que esta é a chave para resolver o “problema dos robôs” – ou seja, como avaliar de forma confiável robôs treinados para múltiplas tarefas em ambientes em constante mudança. Considere um robô que dobra camisetas: seu desempenho pode variar muito ao longo de 50 dias, com sucessos muitas vezes efêmeros.

image.png

A 1X afirma que, mesmo com o mesmo modelo de robô, as mudanças ambientais podem causar grandes flutuações no desempenho, tornando as avaliações práticas rigorosas extremamente difíceis.

Para treinar seus modelos de mundo, a 1X coletou milhares de horas de vídeos gravando seu robô humanoide EVE executando várias tarefas em ambientes domésticos e de escritório. Através do aprendizado de máquina, o modelo agora consegue prever razoavelmente como os objetos e o ambiente irão reagir às ações do robô. Mesmo comportamentos não programados explicitamente, o modelo gera saídas de imagem confiáveis, como aprender a evitar o contato com humanos e objetos.

Atualmente, o modelo da 1X consegue lidar com algumas interações físicas complexas, como pegar e levantar objetos, abrir portas e gavetas, e manipular materiais deformáveis como roupas, inclusive dobrar camisetas.

O valor central de seus modelos de mundo reside na simulação da interação com objetos. Por exemplo, nas próximas gerações, o modelo receberá a mesma imagem inicial e três conjuntos diferentes de ações para pegar uma caixa. Em cada caso, a caixa pega será levantada e movida com o movimento do braço robótico, enquanto as outras caixas permanecem no lugar.

Apesar disso, a 1X reconhece algumas limitações. Por exemplo, o modelo às vezes tem dificuldade em manter a consistência da cor e da forma dos objetos ou simular com precisão os fenômenos físicos. A capacidade de se reconhecer em um espelho também ainda não é muito confiável.

Apesar dos desafios, a 1X considera esses modelos de mundo um marco no desenvolvimento e treinamento de robôs de uso geral. Para acelerar o progresso, a empresa também oferece conjuntos de dados, modelos pré-treinados e prêmios por meio do “Desafio de Modelos de Mundo 1X”.

O objetivo de longo prazo da 1X é usar diretamente os modelos de mundo para o treinamento de robôs, o que proporcionará uma melhoria significativa na eficiência em comparação com os testes reais. Para atingir esse objetivo, a empresa está ativamente recrutando especialistas em inteligência artificial. No início deste ano, a 1X também conseguiu arrecadar US$ 100 milhões para impulsionar o lançamento no mercado de seu robô humanoide doméstico Neo, com o apoio de líderes do setor como a OpenAI, demonstrando a alta expectativa em relação à tecnologia da 1X.

Além da 1X, a Nvidia também está investindo muito em robôs humanoides. A empresa lançou recentemente um método de treinamento usando o Apple Vision Pro, e o pesquisador da Nvidia, Jim Fan, acredita que a robótica terá um “momento GPT-3” nos próximos anos.