DriveVLM

自动驾驶与视觉语言模型的融合

普通产品其他自动驾驶视觉语言模型
DriveVLM是一个自动驾驶系统,它利用视觉语言模型(VLMs)来增强场景理解和规划能力。该系统通过独特的推理模块组合,包括场景描述、场景分析和分层规划,以提高对复杂和长尾场景的理解。此外,为了解决VLMs在空间推理和计算需求上的局限性,提出了DriveVLM-Dual,这是一个混合系统,结合了DriveVLM的优势和传统自动驾驶流程。在nuScenes数据集和SUP-AD数据集上的实验表明,DriveVLM和DriveVLM-Dual在处理复杂和不可预测的驾驶条件方面非常有效。最终,DriveVLM-Dual在生产车辆上进行了部署,验证了其在现实世界自动驾驶环境中的有效性。
打开网站

DriveVLM 最新流量情况

月总访问量

4223

跳出率

65.42%

平均页面访问数

1.1

平均访问时长

00:00:13

DriveVLM 访问量趋势

DriveVLM 访问地理位置分布

DriveVLM 流量来源

DriveVLM 替代品