DriveVLM
Fusion de la conduite autonome et des modèles linguistiques visuels
Produit OrdinaireAutreConduite autonomeModèles linguistiques visuels
DriveVLM est un système de conduite autonome qui utilise les modèles linguistiques visuels (VLMs) pour améliorer la compréhension des scènes et les capacités de planification. Ce système utilise une combinaison unique de modules d'inférence, incluant la description de scène, l'analyse de scène et la planification hiérarchique, afin d'améliorer la compréhension des scènes complexes et des cas atypiques. De plus, pour pallier les limites des VLMs en termes d'inférence spatiale et de besoins en calcul, DriveVLM-Dual a été proposé. Il s'agit d'un système hybride qui combine les avantages de DriveVLM et les processus traditionnels de conduite autonome. Des expériences menées sur les ensembles de données nuScenes et SUP-AD montrent que DriveVLM et DriveVLM-Dual sont très efficaces pour gérer des conditions de conduite complexes et imprévisibles. Enfin, DriveVLM-Dual a été déployé sur des véhicules de production, confirmant son efficacité en environnement de conduite autonome réel.
DriveVLM Dernière situation du trafic
Nombre total de visites mensuelles
2156
Taux de rebond
55.19%
Nombre moyen de pages par visite
1.1
Durée moyenne de la visite
00:00:54