A Hugging Face, em parceria com a Physical Intelligence, lançou o Pi0, um modelo básico de robô revolucionário. É o primeiro modelo de código aberto capaz de traduzir comandos de linguagem natural diretamente em ações robóticas, marcando uma nova era na robótica.
O modelo Pi0 foi treinado em sete plataformas robóticas diferentes, dominando 68 tarefas únicas, desde dobrar roupas até arrumar mesas. Ele utiliza uma inovadora técnica de correspondência de fluxo, gerando trajetórias de movimento suaves em tempo real a 50 Hz, garantindo alta precisão.
Ainda mais notável é o lançamento simultâneo do Pi0-FAST, uma versão aprimorada que emprega um novo esquema de marcação de sequência de ações no espaço de frequência, resultando em um aumento de 5 vezes na velocidade de treinamento e maior capacidade de adaptação entre ambientes.
Remi Cadene, cientista-chefe de pesquisa da Hugging Face, afirma: "O Pi0 é o modelo de ação visual-linguística mais avançado, capaz de traduzir comandos de linguagem natural diretamente em comportamento autônomo."
O modelo já está disponível em código aberto na plataforma Hugging Face, permitindo que desenvolvedores o acessem com apenas algumas linhas de código.
Este avanço pode remodelar diversos setores: fábricas podem reconfigurar tarefas robóticas por meio de comandos vocais, armazéns podem implantar sistemas de automação mais flexíveis, e até mesmo pequenas empresas podem adotar mais facilmente a robótica. No entanto, ainda existem desafios em relação à demanda de recursos computacionais, confiabilidade e segurança.
Para toda a indústria de IA, o lançamento do Pi0 é oportuno. Com a crescente competição no desenvolvimento de inteligência artificial geral, essa tecnologia estabelece com sucesso uma ponte entre modelos de linguagem e o mundo físico, apontando o caminho para o futuro dos robôs inteligentes.