Le Massachusetts Institute of Technology (MIT) a présenté cette semaine un nouveau modèle d'entraînement pour robots, abandonnant les méthodes traditionnelles axées sur des ensembles de données spécifiques au profit d'une approche utilisant une quantité massive d'informations, similaire à celle employée pour les grands modèles de langage (LLM).
Les chercheurs soulignent que l'apprentissage par imitation – où un agent apprend en imitant un individu exécutant une tâche – peut échouer face à de petits défis. Ces défis peuvent inclure des conditions d'éclairage différentes, des configurations environnementales variées ou de nouveaux obstacles. Dans ces cas, le robot ne dispose pas de suffisamment de données pour s'adapter à ces changements.
Source : Image générée par IA, fournie par Midjourney.
L'équipe s'est inspirée de modèles comme GPT-4, adoptant une approche brute de résolution de problèmes basée sur les données.
« Dans le domaine du langage, les données sont des phrases », explique Lirui Wang, principal auteur de l'article. « Dans le domaine de la robotique, étant donné la diversité des données, si l'on souhaite effectuer un pré-entraînement de manière similaire, nous avons besoin d'une architecture différente. »
L'équipe a introduit une nouvelle architecture, appelée Transformateur de Pré-entraînement Hétérogène (HPT), qui intègre des informations provenant de différents capteurs et de différents environnements. Un transformateur est ensuite utilisé pour intégrer ces données dans le modèle d'entraînement. Plus le transformateur est grand, meilleurs sont les résultats.
L'utilisateur fournit ensuite la conception du robot, sa configuration et la tâche qu'il souhaite accomplir.
« Notre rêve est d'avoir un cerveau robotique universel que vous pouvez télécharger et utiliser pour votre robot sans aucun entraînement », a déclaré David Held, professeur adjoint à l'université Carnegie Mellon, à propos de cette recherche. « Bien que nous n'en soyons qu'au début, nous allons continuer à travailler, espérant qu'une augmentation d'échelle, comme pour les grands modèles de langage, permettra des avancées significatives pour les stratégies robotiques. »
Cette recherche a été en partie financée par le Toyota Research Institute. L'année dernière, lors de TechCrunch Disrupt, le TRI a présenté une méthode permettant d'entraîner des robots en une nuit. Récemment, il a conclu un partenariat important, combinant ses recherches en apprentissage robotique avec le matériel de Boston Dynamics.