Ces dernières années, l'intelligence incarnée a connu une popularité fulgurante. De ses performances remarquables lors du spectacle du Nouvel An chinois à sa mention dans le rapport gouvernemental, en passant par les multiples encouragements de Jensen Huang (NVIDIA), elle est devenue un sujet central dans le domaine de l'IA. L'intelligence incarnée vise à permettre aux robots de percevoir et d'interagir avec précision et flexibilité dans le monde réel, à la manière des humains.

Une équipe de recherche conjointe de l'Université Tsinghua et d'Ant Group a réalisé une percée majeure. Dans un article publié à ICLR 2025, ils ont présenté le cadre algorithmique BodyGen. Ce cadre, combinant l'apprentissage par renforcement et les réseaux neuronaux profonds, permet aux robots d'évoluer automatiquement en un temps court vers une morphologie et des stratégies de contrôle optimales adaptées à leur environnement. Les performances ont été améliorées de 60 %, et le code est désormais disponible en open source sur GitHub.

QQ20250325-144947.png

La conception traditionnelle des robots est confrontée à de nombreux défis, tels que la dépendance à une grande quantité de connaissances expertes, la nécessité de nombreuses itérations expérimentales pour des environnements spécifiques, et les problèmes liés à la taille énorme de l'espace de recherche morphologique et au couplage profond entre la morphologie et les stratégies de contrôle dans les techniques de conception collaborative de la forme et du contrôle. Le cadre BodyGen résout efficacement ces problèmes grâce à deux phases : la conception morphologique et l'interaction environnementale. La phase de conception morphologique utilise un modèle auto-régressif Transformer (style GPT) pour construire et optimiser les paramètres de structure physique du robot ; la phase d'interaction environnementale utilise un Transformer (style BERT) pour traiter les informations articulaires et réaliser un retour d'information interactif avec l'environnement.

QQ20250325-144954.png

BodyGen repose sur trois technologies clés. L'encodeur de position de structure physique TopoPE, tel un « système de perception corporelle » pour le robot, aide l'IA à s'adapter rapidement aux changements de morphologie ; MoSAT, basé sur Transformer, agit comme un « centre cérébral », responsable du traitement de l'information et de l'envoi d'instructions ; un mécanisme d'attribution de récompenses spécifique permet à l'IA d'évaluer raisonnablement les décisions de conception.

QQ20250325-145003.png

Lors de tests dans 10 environnements de tâches différents (rampage, natation, etc.), le score d'adaptabilité morphologique des robots générés par BodyGen était supérieur de 60,03 % à celui des méthodes les plus performantes existantes. De plus, avec un nombre de paramètres de seulement 1,43 M, il est plus léger et présente un avantage significatif dans les environnements aux ressources limitées. À l'avenir, l'équipe de recherche prévoit de promouvoir son application dans des scénarios réels. BodyGen pourrait devenir un élément clé du développement de l'intelligence incarnée généralisée.

Adresse : https://github.com/GenesisOrigin/BodyGen