智能网联汽车技术专题-规划&决策2024年
智能汽车信息物理系统(IVCPS)是具有多领域交叉融合特征的复杂大系统,在设计IVCPS领域特定建模语言时,应用现有建模语言存在扩展性差、成熟度低、学习成本高等问题,因此,本文根据V模型和创新架构方法,分别从IVCPS顶层设计流程、IVCPS元语言对象集语言要素定义两部分对面向IVCPS领域特定建模语言(DSML)进行研究,对IVCPS系统层元语言和组件化元语言的规范化进行定义,研究赛博物理组件中表达物理实现、动态特性和赛博计算的组件,以期为赛博物理组件的封装和创建提供参考。
随着Transformer注意力机制的出现,以GPT为代表的通用基础大模型实现了智能的“涌现”,给自动驾驶迈向更高级别发展带来了曙光。受限于传统从头预训练方式需要大规模、高质量、多样性自动驾驶数据和高昂训练成本的困扰,“大模型+对齐技术”范式衍生。对齐技术作为通用基础大模型与自动驾驶之间的纽带,通过微调或提示工程等定制化方式,可高效、专业地解决自动驾驶领域内的工程性问题。对齐技术已是大模型在垂直领域发展的研究热点,但缺乏系统研究成果。基于此,本文首先对自动驾驶发展与大模型技术进行概述,从而衍生出对齐技术。然后,分别从微调和提示工程两个角度进行综述,系统化梳理并剖析各分类技术的结构或性能特点,同时给出实际的应用案例。最后,基于现有研究提出了对齐技术的研究挑战与发展趋势,为促进自动驾驶迈向更高级别发展提供参考。
共享道路空间中的人类驾驶交互行为具有兼顾伴行车损益的社会性特征。由于对驾驶交互社会性的理解缺失,自动驾驶车辆往往难以估计自身行为对伴行车辆的潜在影响,因而陷入“被迫保守”的决策困境。本文在博弈论框架中引入驾驶人兼顾伴行车损益的行为特征,构建社会性驾驶交互行为模型,刻画了驾驶交互中个体间的动作依赖关系。结合该模型,提出主车预期行为对其交互对象所造成潜在影响的通用定量表达——交互效用项。通过在规划目标中引入交互效用项,可定向调整运动规划算法的交互主动性。高速路出匝道实验结果表明,在对安全性无显著影响的前提下,通过提升交互主动性,基于优化和基于采样的运动规划算法在给定距离内出匝道任务成功率可分别提升3.9%与5.2%。
智能车在动态环境中的轨迹规划须具备良好的舒适性及安全性,离散采样轨迹规划算法具有实时性高、多目标最优等优点而被广泛研究和应用,但在仿真及实车测试中发现,典型的基于多项式优化求解的离散采样局部轨迹规划结果在换道等瞬态过程存在一致性较差的问题。本文针对性提出一种考虑一致性评价的“拼接+强规划”轨迹规划算法。具体而言,根据自车状态截取历史轨迹为当前周期拼接轨迹,结合拼接轨迹和轨迹末状态采样点生成基于多项式的候选轨迹簇作为轨迹强规划阶段,再基于轨迹横向偏差设计轨迹一致性评价函数以从轨迹簇中选取较高一致性的最优行驶轨迹。经仿真和真实道路场景实车验证,表明所提出的轨迹规划方法在满足轨迹安全性、平顺性、舒适性要求的基础上提高了智能驾驶车辆行驶轨迹的整体一致性。
车辆轨迹预测是自动驾驶的关键技术之一,针对以往模型较少考虑城市道路场景中车辆以外多类交通参与者的问题,本研究提出了一种多类交通参与者的多模态车辆轨迹预测模型。该模型使用门控循环单元对历史轨迹信息进行编码,并利用注意力机制将多类交通参与者的特征映射到用图结构表达的驾驶场景中,通过图注意力网络进行环境特征提取,从而使模型能感知环境中的多类交通参与者。此外,模型通过节点轨迹预测与坐标轨迹预测模块输出最终的多模态轨迹预测结果。基于城市道路场景数据集nuScenes的实验结果表明:相较于同类现有模型,所提出的模型算力需求更低、预测更准确,且能适用于人车混合的城市道路驾驶场景。
针对常规车辆轨迹预测数据集中较少包含极端交通场景信息的问题,本文提出一种新型对抗性攻击框架来模拟此类场景。首先,为了判定不同场景中对抗性攻击是否有效提出了一种阈值判定的方式;然后,针对攻击目的的不同分别设计了两种对抗性轨迹生成算法,在遵守物理约束和隐蔽性前提下,生成更具对抗性的轨迹样本;此外,提出3个新的评价指标全面评估攻击效果;最后,探究了不同的防御策略来减轻对抗攻击影响。实验结果显示,基于扰动阈值的快速攻击算法(attack algorithm based on perturbation threshold for fast attack,PTFA)和基于动态学习率调整的攻击算法(attack algorithm based on dynamic learning rate adjustment, DLRA)在NGSIM数据集上的攻击时间和扰动效果均优于现有算法,更高效发现模型弱点。本研究通过模拟极端情况丰富了轨迹样本,深入评估了模型鲁棒性,为后续优化奠定了基础。
高速公路智能换道是高级辅助驾驶系统(ADAS)的重要功能,现阶段算法难以在低算力硬件资源条件下兼顾换道安全性和平顺性。为解决此问题,本文提出一种高速公路智能换道系统决策规划方法。通过分级危险区域,检测碰撞风险做出换道决策,进而实施横纵向解耦规划。在横向规划中,设计两阶段五次多项式换道轨迹规划,提升换道途中安全性和平顺性。在纵向规划中,巡航工况采用类PID算法,可提升规划实时性,而跟车工况采用基于同步预测时域的模型预测控制(MPC)算法,通过关联横纵向规划时间可提升换道平顺性,并设计代价函数降低求解复杂度可满足低资源占用要求。通过实车对比试验,验证了该方法在高速公路换道多场景中具有较高的安全性、平顺性和体验感。此外,算法占用的静态区存储和栈区峰值存储测试对比结果表明了该方法具有较低的硬件资源占用率,可满足低算力控制器对资源占用的要求。
近年来,考虑安全与效率的自动驾驶矿车路径规划方法已逐渐成熟,并在多种矿山场景落地应用。与此同时,产业界和学术界也开始关注如何利用路径规划提升矿车的燃油经济性。针对这一需求,本文提出了一种矿山场景下的自动驾驶矿车节能路径规划方法,其主要特点是根据车速、道路坡度及障碍物进行S-L(进度-偏离)和S-T(进度-时间)的复合动态采样。针对矿山典型地形场景,建立了矿车燃油消耗指标,提出了安全性-运行效率-能耗综合路径评价模型;为了防止评价模型的各项权重陷入局部最优,设计了基于模拟退火策略的粒子群自适应优化方法。在矿山实际场景的测试中,本研究提出方法较现有方法在燃油经济性指标上平均提升了11.28%。
半挂车辆的非稳定运动学特性为其泊车过程中自主运动规划带来严峻挑战。针对半挂车在多障碍物的静态场景中泊车运动规划算法效率低、结果平滑性差等问题,本文提出了序列式运动规划方法(sequential motion planning algorithm, SMPA)。首先,提出了基于二次规划策略和改进双向快速扩展随机树(bidirectional rapidly-exploring random tree algorithm,Bi-RRT)的初始路径生成方法。然后,结合车辆非完整微分约束下的路径节点可行性判别方法研究,提出基于概率的目标偏向采样策略,提高了采样效率。最后,构建了面向车辆系统控制变量连续性的非线性最优化控制模型,解决泊车换向点的对接问题,提高了泊车轨迹平滑性。仿真结果表明,该方法在多障碍物场景中,规划时间相比Hybrid A*和Bi-RRT分别降低了86.71%和21.44%,轨迹质量也更具优越性。
混合交通流下由于驾驶员意图的不确定性行驶轨迹将呈现多模态属性,为了提高安全性并实现个性化驾驶,本文提出一种基于环境车辆多模态轨迹预测的智能车轨迹规划算法。首先,结合图卷积神经网络(GCN)和长短期记忆网络(LSTM)并加入注意力机制建立轨迹预测模型,预测不同行驶意图下的未来轨迹概率分布。然后,针对环境车辆的多意图概率下预测轨迹集合,根据自动驾驶风格偏好,设定一定的概率阈值挑选出确信轨迹,将其投影到规划路径上生成S-T图,并通过动态规划和二次规划进行基于碰撞风险规避的速度规划。最后,基于模型预测控制(MPC)对本文模型在典型换道场景和NGSIM真实道路场景下进行仿真测试并与现有模型进行对比验证。结果表明:本文提出的模型在安全性、舒适性和行车效率等方面均优于对比模型,能够在准确预测环境车辆未来轨迹的前提下实现最优轨迹规划,保证自动驾驶汽车安全、高效的行驶。
为完善复杂道路场景下智能驾驶车辆的碰撞风险评估方法,实时生成有效避险轨迹,本文提出了一种基于时空风险的智能驾驶车辆避险决策规划方法。首先,采用时空耦合的多域风险度量作为评估指标,监督智能驾驶车辆横纵向碰撞风险,同时实时监测行车风险指标变化,通过与典型避险场景风险数据库间的相关性分析,判断潜在碰撞风险大小,从而提前规避风险。然后,依据行车风险场对车辆目标状态进行不均匀采样,规避行车风险较高的驾驶区域,提高避险规划的安全性和实时性。试验结果表明,所提出的避险决策规划方法可安全有效地避开横纵向碰撞风险,并且根据风险指标的时域相关性分析可提前0.5 s发现潜在碰撞风险,从而提前平稳规避风险,不均匀采样可将避险轨迹平均规划时间由0.13 缩短到0.07 s。
当前车辆路径规划大部分是基于栅格地图的规划方法,这种方法在搜索面积较大时计算量也会大幅增加。相比之下,基于可视图的方法能够在路径搜索时减小计算量,但是受到障碍物复杂程度的影响较大。针对这一问题,本文结合SLAM和可视图的方法,提出了一种简化可视图的建图和规划方法。首先使用改进的SLAM算法生成点云地图,并进行动态障碍物的剔除。接着生成可视图,并基于障碍物的大小和顶点处内凹角的大小对可视图中多边形的复杂边缘进行简化,剔除冗余的顶点。最后通过仿真和实车实验证明,该方法相对原有的算法,在保证建图精度的情况下,可视图中多边形的顶点数量减少20%~30%,地图更新时间和整体算法的运行时间减少30%以上。这表明本文方法能够有效减小建图和规划过程的计算量和算法的运行时间。
针对曲线道路的路径规划问题,本文提出一种基于全局导向人工势场法的路径规划融合算法。考虑持续转弯的弯曲道路工况,构建基于变形栅格的栅格地图;考虑道路环境中的行车风险,基于行车风险场理论优化A*算法启发函数从而改进A*算法。改进传统人工势场法的局限性及固有缺陷,在局部路径规划中考虑自车、环境车辆及障碍物的轮廓形状,引入全局导向路径进一步改进人工势场法。以改进A*算法规划路径为全局最优导向路径,设计基于改进人工势场法的路径规划融合算法。仿真结果表明,提出的融合算法可以生成有效的行驶路径,与数据集提取的实车路径接近,且在障碍物环境中规划的路径安全高效,满足车辆的行驶要求。
针对动态非结构环境下的智能车辆轨迹规划,提出了一种基于图搜索和优化的轨迹规划方法。首先,采用图搜索方法对智能车辆运动基元进行搜索,获取符合运动学特性的初始轨迹;然后,基于非线性模型预测控制方法对轨迹进行优化,以获得更平滑、更安全的轨迹。为在动态非结构环境下实现基元的快速且安全的拓展,提出了一种基元碰撞检测的方法。该方法通过障碍物膨胀和栅格离散运动基元,对非规则障碍物进行静态碰撞检测,引入速度障碍物概念,在速度空间对动态障碍物进行动态碰撞检测。在ROS/Gazebo环境下进行了算法仿真比较,并通过场地试验进行了测试评价。结果表明,相较于TEB算法,所提轨迹规划方法在满足计算实时性要求的同时,平均避障成功率提高了18%,展现出了更高的安全避障能力和可行性。
为兼顾自动驾驶车辆在极限工况下的稳定性与轨迹跟踪性能,提出了一种基于自主漂移的自动驾驶车辆轨迹规划与控制方法。基于神经网络设计了神经网络轮胎动力学模型,提升了传统魔术轮胎公式的精度。为进一步拓展自动驾驶车辆极限工况下的稳定边界,基于漂移时轮胎饱和及最大侧滑特性结合质心侧偏角-横摆角速度相平面约束设计了漂移稳定边界,采用非线性模型预测控制(NMPC)在更大稳定范围内规划了安全漂移轨迹,并对规划轨迹进行了漂移跟踪控制。Simulink/CarSim联合仿真结果表明,该方法可充分利用漂移运动优势,在极限工况下确保车辆不发生失控,同时准确跟踪期望轨迹。
预见性巡航控制(predictive cruise control,PCC)在规划层以预测节能为目标进行长时域的速度规划,执行层对规划速度进行短时域的跟踪控制。由于规划层与执行层有着不同时间尺度步长要求,在系统设计中很难将二者置于一个优化控制问题中。因此,本文采用分层控制思想,在规划层基于改进的双延迟深度确定性策略梯度算法(twin delayed deep deterministic policy gradient algorithm,TD3)获得预测时域内长周期的规划速度;在执行层基于模型预测控制(model predictive control,MPC)以规划速度为参考速度,同时考虑发动机油耗特性和变速器换挡规律,对规划速度在短时域内作进一步的经济性优化,并进行跟踪控制。硬件在环验证结果表明,将改进的TD3与MPC相结合可以改善PCC在规划与执行中的时间尺度不一致问题,并有效降低重型商用车在巡航过程中的燃油消耗量和换挡频次。
在共享道路空间中不同流向道路使用者间存在通行路径冲突,为规避碰撞风险,道路使用者须通过驾驶交互进行路权协商,从而消解潜在冲突。对交互行为的表述和建模,对于准确理解和预测动态环境具有重要意义。为此,本文提出一种以交互基元为分析单元的多车驾驶交互行为语义级表征和提取方法。首先,利用非参数贝叶斯方法对交互驾驶行为进行分割,得到具有显著行为模式的驾驶交互片段。然后,利用黏性层次狄利克雷-隐马尔可夫模型,从驾驶交互片段中提取得到交互基元。最后,对规范化处理后的交互基元进行无监督聚类,以获得驾驶交互场景的语义级行为特征。基于NGSIM高速公路数据集中20 797组多车交互数据的实证研究,本文提出的方法可提取并分析多个体参与的复杂交互场景,突破了已有研究中只针对两车交互场景构建交互基元的局限性,可支撑对多交通参与者交互的本质进行分析。实验结果表明,本文所提出的方法可以将连续的驾驶行为划分为离散的交互基元。且聚类划分结果可以与实际交互场景相对应,用于不同交互轨迹基元中车辆之间的交互行为特性分析。同时,该方法对于复杂场景下游驾驶任务具有提升作用。在车辆多步轨迹预测任务中,相比于基线方法,本文所提出的交互基元提取方法在与基线预测方法融合后可以将平均预测误差和终点预测误差分别降低19.3%和14.6%。
针对目前基于监督学习的轨迹预测模型数据利用效率低、精度有限的问题,提出一种轨迹预测模型及通用的自监督预训练策略。首先,基于Transformer搭建轻量化的轨迹预测模型,实现场景时序空间特征提取与交互关系建模;其次,设计运动信息时序掩码、道路信息空间掩码、交互关系掩码3类掩码重建任务对模型进行自监督预训练,以提升模型对场景通用特征的提取能力;最后,以预训练权重为初始化参数在下游任务中进行监督学习微调。在Argoverse2 Motion Forecasting数据集的实验表明,模型在预训练任务中能够很好地重建出交通场景,引入自监督预训练能够有效提升预测精度和数据利用效率,且对不同预测任务具有通用性,在单目标轨迹预测与多目标轨迹预测任务上minFDE6指标分别提升3.3%与3.7%。
精确预测邻近车辆的未来轨迹对自动驾驶汽车的决策和运动规划至关重要,现有研究倾向于利用递归神经网络(RNN)对车辆的时间交互进行建模,但其对车辆交互建模的可解释性差,忽略了实际的车道结构,在捕捉车辆与其环境的交互方面存在不足。为解决这一问题,本文提出了一种基于图卷积交互网络的考虑车道拓扑约束的车辆轨迹预测模型。其中车辆交互关系提取模块在构建车辆的空间关系时增加了边缘权重,以考虑车辆的邻近交互,使交互更具可解释性;行驶场景表征模块旨在通过从高精地图中提取车道拓扑来提高车辆轨迹预测的准确性;轨迹预测模块将上述两个模块的输出进行集成,并输出预测的未来轨迹。这种集成允许对道路结构和车辆行驶轨迹之间的相互作用进行更精确的建模。实验结果表明,与主流方法相比,该模型在Argoverse数据集上取得了良好的性能,提高了复杂道路结构下车辆轨迹规划的准确性和合理性。
在真实驾驶环境中,由于感知数据的噪声和其他交通参与者难以预测的行为意图,自动驾驶汽车如何在高度交互的复杂驾驶环境中考虑不确定性因素的影响,做出合理的决策,是当前决策规划系统须解决的主要问题之一。本文提出了一种不确定性环境下的自动驾驶汽车行为决策方法,为消除不确定性的影响,将行为决策过程转化为部分可观察马尔可夫决策过程(POMDP)。同时为解决POMDP模型计算复杂度过高的问题,首次将复杂网络理论应用于自动驾驶汽车周围微观的驾驶环境,对自动驾驶汽车驾驶环境进行动态建模,实现了车辆节点间交互关系的有效刻画,并对重要车辆节点进行科学筛选,用于指导自车的行为决策,实现对关键车辆节点的精准识别和决策空间的剪枝。在仿真环境中验证了所提方法的有效性,实验结果表明,与现有最先进的行为决策方法相比,所提出的方法拥有更高的计算效率,且拥有更好的性能和灵活性。