Un drone contrôlé par une IA basée sur un modèle multimodal

Une équipe de l'Université des sciences et technologies de l'aéronautique et de l'astronautique de Beijing a publié un article sur Quantum位, présentant une architecture d'agent intelligent incarné basée sur un grand modèle multimodal. Cette architecture a été appliquée avec succès au pilotage de drones.

Grâce à un pont ROSchain, l'architecture connecte le "cerveau" (le modèle multimodal) au système ROS. L'agent ainsi créé, baptisé AeroAgent, a surpassé les modèles traditionnels lors de divers tests, démontrant un potentiel d'application considérable.