SheepNav
精选8天前0 投票

PersonaDrive:用于闭环驾驶仿真的人类风格检索增强VLA智能体

概述

自动驾驶仿真中,非自车交通智能体(traffic agents)的行为模式往往单一,要么基于规则,要么通过单一行为模式训练。最近,加州大学欧文分校的研究人员提出 PersonaDrive,一种基于检索增强的视觉-语言-动作(VLA)模型,能从人类风格驾驶数据中学习,生成具有不同驾驶风格的非自车智能体,用于闭环仿真。

核心方法

PersonaDrive 包含三个阶段的流程:

  1. 离线三元组挖掘:从人类在 CARLA 仿真器上按激进、中性和保守指令驾驶的数据中,利用图像-文本相似度分数挖掘风格特定的三元组。
  2. 轻量级检索头训练:将冻结的视觉特征与小型控制编码器融合,为每种风格训练一个检索头,查询对应风格的数据库。
  3. VLA 主干微调:在单一路径预测模型中,将检索到的上下文点作为行为示例,进行上下文学习。

推理时,只需切换检索头查询的数据库,即可改变智能体的驾驶风格,无需针对每种风格重新训练。

性能表现

在 Bench2Drive 基准上,PersonaDrive(无风格条件)的驾驶分数比 SimLingo 高 4.6%,比 HiP-AD 高 2.5%。在风格条件模式下,每种风格下的驾驶分数均达到最高,且弱风格比最强基线 DMW 高 5.4%。从保守到激进指令,平均速度和加速度分别提升 18%25%

意义与影响

PersonaDrive 解决了仿真中非自车智能体行为单一的问题,通过人类风格数据实现多样化的驾驶行为,有助于更真实地测试自动驾驶系统。其无需重新训练的切换机制降低了部署成本,为闭环仿真提供了更自然的交通流。

延伸阅读

  1. Reframe:让你像1999年一样冲浪
  2. pumaDB:为AI智能体打造的小型托管内存层
  3. Pixlie:AI视频工作室,用文本和图像生成视频,并实现精准控制
查看原文