Dans le domaine de la robotique, la startup américaine Figure AI a récemment lancé Helix, un modèle de langage embarqué de grande taille, marquant une avancée majeure dans le contrôle des robots humanoïdes. Helix est le premier modèle vision-langage-action (VLA) capable de contrôler à haute fréquence et en continu tout le haut du corps d'un robot humanoïde (tête, torse, poignets et doigts). Cela signifie que le robot peut exécuter des tâches directement à partir d'instructions en langage naturel, sans nécessiter un entraînement intensif.
Figure AI a résolu le dilemme entre la généralisation et la vitesse des modèles vision-langage en créant deux systèmes complémentaires. Le système 1 est un modèle de stratégie visuo-motrice à réponse rapide, capable d'exécuter 200 actions précises par seconde, tandis que le système 2 est un modèle vision-langage open source capable de comprendre des scènes complexes et le langage naturel. Ces deux systèmes communiquent efficacement grâce à un entraînement de bout en bout, surmontant ainsi les limitations des robots humanoïdes traditionnels dans l'exécution de tâches diversifiées.
Plus impressionnant encore, Helix peut fonctionner non seulement sur un seul robot, mais aussi sur deux robots en collaboration, une première. Lors de plusieurs démonstrations, deux robots équipés d'Helix ont réussi à trier une pile d'objets hétéroclites jamais vus auparavant. Pour accomplir cette tâche, les robots ont dû « confirmer » visuellement leurs actions, se regardant mutuellement pour s'assurer de la bonne transmission de l'information. Cette collaboration robotique démontre non seulement la puissance d'Helix, mais suggère également que l'interaction future entre les robots humanoïdes et les humains sera plus naturelle et efficace.
Avec seulement 500 heures de données supervisées de haute qualité, Helix peut facilement identifier et manipuler des milliers d'objets ménagers de petite taille. Sur de simples instructions, le robot peut accomplir avec précision des tâches jamais démontrées auparavant, révélant une flexibilité et une intelligence remarquables.
Avec le lancement d'Helix, Figure AI mène une levée de fonds ambitieuse visant 1,5 milliard de dollars, ce qui devrait porter la valorisation de la société à 39,5 milliards de dollars. Ce chiffre, près de 14 fois supérieur à celui de l'année dernière, reflète l'énorme intérêt et le potentiel du marché de la robotique.