Une percée majeure dans le domaine de la robotique ! Xingdong Jiyuan a récemment lancé ERA-42, son propre grand modèle de robot natif de bout en bout, et l'a combiné à sa main agile à cinq doigts Xingdong XHAND1. Pour la première fois, un seul grand modèle incarné permet de réaliser plus de 100 tâches complexes et précises. Cela inclut des actions de haute difficulté telles que prendre une vis et la serrer avec un tournevis, frapper un clou avec un marteau, redresser un verre et verser de l'eau, marquant une nouvelle étape dans l'intelligence robotique.
La puissance d'ERA-42 réside dans son excellente polyvalence et sa capacité de manipulation agile. Il n'a besoin d'aucune compétence de préprogrammation pour apprendre de nouvelles tâches en peu de temps. Avec un minimum de collecte de données, ERA-42 peut maîtriser de nouvelles compétences en moins de deux heures et continue d'apprendre rapidement de nouvelles tâches.

Xingdong Jiyuan estime que les grands modèles incarnés sont la clé pour ouvrir la voie aux agents d'intelligence artificielle incarnée universels. Un excellent grand modèle incarné doit présenter trois éléments clés : premièrement, unifier un modèle pour généraliser plusieurs tâches et environnements, en fusionnant des informations multimodales telles que la vision, le langage, le toucher et la posture corporelle pour réaliser une capacité de généralisation à différentes tâches et environnements ; deuxièmement, de bout en bout, de la réception des données multimodales à la génération des décisions et des actions finales, en utilisant une chaîne de réseaux neuronaux simple sans intervention humaine pour une adaptation en temps réel ; troisièmement, la mise à l'échelle (Scaling up), par l'accumulation continue de données pour l'auto-amélioration, améliorant ainsi les performances et la capacité de généralisation.
Pour réaliser l'apprentissage de bout en bout, Xingdong Jiyuan a adopté une stratégie d'apprentissage de données vidéo à grande échelle, couvrant les données vidéo non annotées, les données robotiques de toutes sortes, les données d'activité humaine et les données de téléopération, et a appris les résultats des actions sur cette base, réduisant efficacement le coût de collecte de données. De plus, Xingdong Jiyuan a intégré un modèle du monde dans le grand modèle de robot natif, permettant au robot non seulement d'avoir une capacité d'action, mais aussi une compréhension du monde physique, de prédire les trajectoires d'action futures et de réagir rapidement aux interférences externes, optimisant continuellement son comportement pendant l'exécution des tâches.

Comparé aux robots à pinces traditionnels, la main agile à cinq doigts Xingdong XHAND1 basée sur ERA-42 peut utiliser plus d'outils et effectuer des tâches plus complexes et plus précises. Par exemple, après une simple formation sur la saisie de blocs de couleur, ERA-42 peut réussir la généralisation de la saisie d'objets divers jamais vus auparavant. Face à des tâches uniques ou à de longues séquences de tâches, ERA-42 a également démontré une forte capacité de résistance aux interférences. Avec l'augmentation de l'échelle du modèle, le taux de réussite des tâches a également considérablement augmenté.
Pour construire un agent d'intelligence artificielle incarnée universel, Xingdong Jiyuan a également lancé une nouvelle plate-forme matérielle définie par l'IA. Prenons l'exemple de Xingdong XHAND1, qui possède 12 degrés de liberté actifs et utilise un entraînement entièrement électrique pour réaliser un entraînement entièrement autonome des articulations des cinq doigts. Chaque doigt est également équipé d'un capteur de matrice tactile haute résolution capable de fournir des informations précises sur la force tridimensionnelle et la température.
Grâce à ERA-42, la polyvalence et la capacité de généralisation des tâches exécutées par le robot humanoïde universel de Xingdong Jiyuan seront considérablement améliorées. Combiné à ses capacités de marche et de course stables précédemment publiées, ainsi qu'à ses capacités de coopération entre les membres supérieurs et inférieurs, les scénarios d'application potentiels seront plus diversifiés, et l'implémentation industrielle des agents d'intelligence artificielle incarnée universels natifs devrait être réellement réalisée. Cette percée technologique accélérera sans aucun doute l'arrivée des robots dans tous les foyers et leur permettra de jouer un rôle plus important dans divers secteurs.