DriveVLM

Fusion de la conduite autonome et des modèles linguistiques visuels

Produit OrdinaireAutreConduite autonomeModèles linguistiques visuels
DriveVLM est un système de conduite autonome qui utilise les modèles linguistiques visuels (VLMs) pour améliorer la compréhension des scènes et les capacités de planification. Ce système utilise une combinaison unique de modules d'inférence, incluant la description de scène, l'analyse de scène et la planification hiérarchique, afin d'améliorer la compréhension des scènes complexes et des cas atypiques. De plus, pour pallier les limites des VLMs en termes d'inférence spatiale et de besoins en calcul, DriveVLM-Dual a été proposé. Il s'agit d'un système hybride qui combine les avantages de DriveVLM et les processus traditionnels de conduite autonome. Des expériences menées sur les ensembles de données nuScenes et SUP-AD montrent que DriveVLM et DriveVLM-Dual sont très efficaces pour gérer des conditions de conduite complexes et imprévisibles. Enfin, DriveVLM-Dual a été déployé sur des véhicules de production, confirmant son efficacité en environnement de conduite autonome réel.
Ouvrir le site Web

DriveVLM Dernière situation du trafic

Nombre total de visites mensuelles

2156

Taux de rebond

55.19%

Nombre moyen de pages par visite

1.1

Durée moyenne de la visite

00:00:54

DriveVLM Tendance des visites

DriveVLM Distribution géographique des visites

DriveVLM Sources de trafic

DriveVLM Alternatives