Récemment, Galaxy General Technology, en collaboration avec l'Institut de recherche sur l'intelligence artificielle de Beijing, l'Université de Beijing et l'Université de Hong Kong, a lancé avec succès GraspVLA, un grand modèle d'apprentissage profond pour la préhension incarnée de bout en bout. Ce lancement marque une avancée majeure dans la technologie de l'intelligence incarnée, dotant le modèle de capacités complètes de perception, d'apprentissage et d'interaction avec l'environnement.

L'entraînement de GraspVLA comprend deux phases : la pré-formation et l'entraînement fin. La pré-formation s'appuie sur un milliard d'images, garantissant une grande généralisation du modèle dans divers scénarios et une capacité de test zéro-shot. Cela signifie que le modèle peut démontrer d'excellentes performances de préhension même dans des environnements et des tâches inconnus. Cette amélioration laisse présager une augmentation significative de la flexibilité et de l'adaptabilité des robots intelligents dans leurs applications pratiques.

Robot, Intelligence Artificielle, IA

Source : Image générée par IA, fournisseur de services d'autorisation d'images Midjourney

Les sept « gold standards » de généralisation ont également été publiés, offrant au secteur de nouvelles bases d'évaluation. Ces normes définissent des objectifs clairs pour les développeurs et guident les chercheurs dans l'optimisation des modèles et les applications pratiques. Galaxy General affirme que GraspVLA apportera un soutien puissant à la manipulation autonome des robots, à la reconnaissance d'objets et à l'interaction dans des environnements complexes.

Avec les progrès constants de l'intelligence artificielle, les perspectives d'application de la technologie de préhension incarnée sont vastes. GraspVLA, en tant que pionnier dans ce domaine, jouera un rôle important dans de nombreux secteurs, notamment la logistique d'entreposage, l'industrie manufacturière et les services médicaux. À l'avenir, les robots ne seront plus limités à des tâches répétitives simples ; ils pourront apprendre et s'adapter à différents environnements, accomplir des tâches plus complexes et même interagir plus naturellement avec les humains.

Lors de cette conférence de lancement, les différentes institutions participantes ont également déclaré qu'elles continueraient à œuvrer au développement de ce domaine et à explorer des scénarios d'application plus pratiques. Le lancement de GraspVLA marque une étape importante vers une nouvelle ère pour les robots intelligents, une ère où ils « sauront saisir ».