Na área de robótica, a startup americana Figure AI lançou recentemente um modelo de linguagem grande para edge chamado Helix, marcando um grande avanço na tecnologia de controle de robôs humanoides. O Helix é o primeiro modelo de visão-linguagem-ação (VLA) capaz de controlar continuamente e em alta frequência todo o torso superior de um robô humanoide (incluindo cabeça, tronco, pulsos e dedos). Isso significa que o robô pode executar tarefas diretamente a partir de instruções em linguagem natural, sem necessidade de extenso treinamento.
A Figure AI resolveu a contradição entre a generalidade e a velocidade dos modelos de visão-linguagem construindo dois sistemas complementares. O Sistema 1 é um modelo de estratégia de movimento visual de resposta rápida, capaz de executar 200 ações precisas por segundo, enquanto o Sistema 2 é um modelo de visão-linguagem de código aberto capaz de entender cenários complexos e linguagem natural. Esses dois sistemas se comunicam de forma eficiente por meio de treinamento de ponta a ponta, superando as limitações que os robôs humanoides enfrentavam anteriormente na execução de tarefas diversificadas.
Ainda mais emocionante é que o Helix não só pode ser executado em um único robô, mas também é o primeiro modelo de IA capaz de realizar colaboração entre dois robôs. Em uma série de demonstrações, dois robôs equipados com o Helix enfrentaram uma pilha de objetos desconhecidos e conseguiram classificá-los com sucesso em colaboração. Para concluir a tarefa, os robôs precisaram de "confirmação" visual, olhando um para o outro para garantir a comunicação precisa da informação. Essa forma de colaboração robô-robô não apenas demonstra a capacidade do Helix, mas também sugere que a interação futura entre robôs humanoides e humanos será mais natural e eficiente.
Com apenas 500 horas de dados supervisionados de alta qualidade, o Helix consegue facilmente identificar e manipular milhares de pequenos itens domésticos. Sob instruções simples, o robô consegue executar tarefas nunca antes demonstradas com precisão, mostrando sua incrível flexibilidade e inteligência.
Com o lançamento do Helix, a Figure AI também está buscando ativamente financiamento, com uma meta de US$ 1,5 bilhão, e espera que a avaliação da empresa chegue a US$ 39,5 bilhões. Esse número representa um aumento de quase 14 vezes em comparação com o ano passado, refletindo o enorme interesse e potencial do mercado para a tecnologia robótica.