智能网联汽车技术专题-规划&决策2024年
随着Transformer注意力机制的出现,以GPT为代表的通用基础大模型实现了智能的“涌现”,给自动驾驶迈向更高级别发展带来了曙光。受限于传统从头预训练方式需要大规模、高质量、多样性自动驾驶数据和高昂训练成本的困扰,“大模型+对齐技术”范式衍生。对齐技术作为通用基础大模型与自动驾驶之间的纽带,通过微调或提示工程等定制化方式,可高效、专业地解决自动驾驶领域内的工程性问题。对齐技术已是大模型在垂直领域发展的研究热点,但缺乏系统研究成果。基于此,本文首先对自动驾驶发展与大模型技术进行概述,从而衍生出对齐技术。然后,分别从微调和提示工程两个角度进行综述,系统化梳理并剖析各分类技术的结构或性能特点,同时给出实际的应用案例。最后,基于现有研究提出了对齐技术的研究挑战与发展趋势,为促进自动驾驶迈向更高级别发展提供参考。
预见性巡航控制(predictive cruise control,PCC)在规划层以预测节能为目标进行长时域的速度规划,执行层对规划速度进行短时域的跟踪控制。由于规划层与执行层有着不同时间尺度步长要求,在系统设计中很难将二者置于一个优化控制问题中。因此,本文采用分层控制思想,在规划层基于改进的双延迟深度确定性策略梯度算法(twin delayed deep deterministic policy gradient algorithm,TD3)获得预测时域内长周期的规划速度;在执行层基于模型预测控制(model predictive control,MPC)以规划速度为参考速度,同时考虑发动机油耗特性和变速器换挡规律,对规划速度在短时域内作进一步的经济性优化,并进行跟踪控制。硬件在环验证结果表明,将改进的TD3与MPC相结合可以改善PCC在规划与执行中的时间尺度不一致问题,并有效降低重型商用车在巡航过程中的燃油消耗量和换挡频次。
为保障高级别辅助驾驶系统决策的安全性和可靠性,提出一种基于动态场景行车风险评估的车辆辅助驾驶行为决策方法。首先,基于势场理论分别建立障碍物风险评估模型和虚拟车道风险评估模型,用以描述动态交通场景对行驶车辆所产生的驾驶风险;其次,根据车辆换道过程将换道行为分为换道动机产生和目标车道安全决策两个阶段,提出换道场景风险评估指标,制定安全换道规则,采用公开数据集分析验证了换道场景下风险评估指标的表征能力;之后,基于实时交通环境信息,确定车道内驾驶行为决策方法,实现多种驾驶场景下的行为安全决策;最后,在PreScan/CarSim/Simulink联合仿真平台和实车试验平台上对所提出的车辆辅助驾驶行为决策方法进行验证。结果表明,所提出的风险评估模型和驾驶行为决策方法,能够准确识别并评估行车风险,并实时决策车辆应采取的合理驾驶行为,有效保证了高级别辅助驾驶系统的行车安全。
精确预测邻近车辆的未来轨迹对自动驾驶汽车的决策和运动规划至关重要,现有研究倾向于利用递归神经网络(RNN)对车辆的时间交互进行建模,但其对车辆交互建模的可解释性差,忽略了实际的车道结构,在捕捉车辆与其环境的交互方面存在不足。为解决这一问题,本文提出了一种基于图卷积交互网络的考虑车道拓扑约束的车辆轨迹预测模型。其中车辆交互关系提取模块在构建车辆的空间关系时增加了边缘权重,以考虑车辆的邻近交互,使交互更具可解释性;行驶场景表征模块旨在通过从高精地图中提取车道拓扑来提高车辆轨迹预测的准确性;轨迹预测模块将上述两个模块的输出进行集成,并输出预测的未来轨迹。这种集成允许对道路结构和车辆行驶轨迹之间的相互作用进行更精确的建模。实验结果表明,与主流方法相比,该模型在Argoverse数据集上取得了良好的性能,提高了复杂道路结构下车辆轨迹规划的准确性和合理性。
为兼顾自动驾驶车辆在极限工况下的稳定性与轨迹跟踪性能,提出了一种基于自主漂移的自动驾驶车辆轨迹规划与控制方法。基于神经网络设计了神经网络轮胎动力学模型,提升了传统魔术轮胎公式的精度。为进一步拓展自动驾驶车辆极限工况下的稳定边界,基于漂移时轮胎饱和及最大侧滑特性结合质心侧偏角-横摆角速度相平面约束设计了漂移稳定边界,采用非线性模型预测控制(NMPC)在更大稳定范围内规划了安全漂移轨迹,并对规划轨迹进行了漂移跟踪控制。Simulink/CarSim联合仿真结果表明,该方法可充分利用漂移运动优势,在极限工况下确保车辆不发生失控,同时准确跟踪期望轨迹。
针对曲线道路的路径规划问题,本文提出一种基于全局导向人工势场法的路径规划融合算法。考虑持续转弯的弯曲道路工况,构建基于变形栅格的栅格地图;考虑道路环境中的行车风险,基于行车风险场理论优化A*算法启发函数从而改进A*算法。改进传统人工势场法的局限性及固有缺陷,在局部路径规划中考虑自车、环境车辆及障碍物的轮廓形状,引入全局导向路径进一步改进人工势场法。以改进A*算法规划路径为全局最优导向路径,设计基于改进人工势场法的路径规划融合算法。仿真结果表明,提出的融合算法可以生成有效的行驶路径,与数据集提取的实车路径接近,且在障碍物环境中规划的路径安全高效,满足车辆的行驶要求。
针对动态非结构环境下的智能车辆轨迹规划,提出了一种基于图搜索和优化的轨迹规划方法。首先,采用图搜索方法对智能车辆运动基元进行搜索,获取符合运动学特性的初始轨迹;然后,基于非线性模型预测控制方法对轨迹进行优化,以获得更平滑、更安全的轨迹。为在动态非结构环境下实现基元的快速且安全的拓展,提出了一种基元碰撞检测的方法。该方法通过障碍物膨胀和栅格离散运动基元,对非规则障碍物进行静态碰撞检测,引入速度障碍物概念,在速度空间对动态障碍物进行动态碰撞检测。在ROS/Gazebo环境下进行了算法仿真比较,并通过场地试验进行了测试评价。结果表明,相较于TEB算法,所提轨迹规划方法在满足计算实时性要求的同时,平均避障成功率提高了18%,展现出了更高的安全避障能力和可行性。
在共享道路空间中不同流向道路使用者间存在通行路径冲突,为规避碰撞风险,道路使用者须通过驾驶交互进行路权协商,从而消解潜在冲突。对交互行为的表述和建模,对于准确理解和预测动态环境具有重要意义。为此,本文提出一种以交互基元为分析单元的多车驾驶交互行为语义级表征和提取方法。首先,利用非参数贝叶斯方法对交互驾驶行为进行分割,得到具有显著行为模式的驾驶交互片段。然后,利用黏性层次狄利克雷-隐马尔可夫模型,从驾驶交互片段中提取得到交互基元。最后,对规范化处理后的交互基元进行无监督聚类,以获得驾驶交互场景的语义级行为特征。基于NGSIM高速公路数据集中20 797组多车交互数据的实证研究,本文提出的方法可提取并分析多个体参与的复杂交互场景,突破了已有研究中只针对两车交互场景构建交互基元的局限性,可支撑对多交通参与者交互的本质进行分析。实验结果表明,本文所提出的方法可以将连续的驾驶行为划分为离散的交互基元。且聚类划分结果可以与实际交互场景相对应,用于不同交互轨迹基元中车辆之间的交互行为特性分析。同时,该方法对于复杂场景下游驾驶任务具有提升作用。在车辆多步轨迹预测任务中,相比于基线方法,本文所提出的交互基元提取方法在与基线预测方法融合后可以将平均预测误差和终点预测误差分别降低19.3%和14.6%。
智能汽车信息物理系统(IVCPS)是具有多领域交叉融合特征的复杂大系统,在设计IVCPS领域特定建模语言时,应用现有建模语言存在扩展性差、成熟度低、学习成本高等问题,因此,本文根据V模型和创新架构方法,分别从IVCPS顶层设计流程、IVCPS元语言对象集语言要素定义两部分对面向IVCPS领域特定建模语言(DSML)进行研究,对IVCPS系统层元语言和组件化元语言的规范化进行定义,研究赛博物理组件中表达物理实现、动态特性和赛博计算的组件,以期为赛博物理组件的封装和创建提供参考。
当前车辆路径规划大部分是基于栅格地图的规划方法,这种方法在搜索面积较大时计算量也会大幅增加。相比之下,基于可视图的方法能够在路径搜索时减小计算量,但是受到障碍物复杂程度的影响较大。针对这一问题,本文结合SLAM和可视图的方法,提出了一种简化可视图的建图和规划方法。首先使用改进的SLAM算法生成点云地图,并进行动态障碍物的剔除。接着生成可视图,并基于障碍物的大小和顶点处内凹角的大小对可视图中多边形的复杂边缘进行简化,剔除冗余的顶点。最后通过仿真和实车实验证明,该方法相对原有的算法,在保证建图精度的情况下,可视图中多边形的顶点数量减少20%~30%,地图更新时间和整体算法的运行时间减少30%以上。这表明本文方法能够有效减小建图和规划过程的计算量和算法的运行时间。
针对目前基于监督学习的轨迹预测模型数据利用效率低、精度有限的问题,提出一种轨迹预测模型及通用的自监督预训练策略。首先,基于Transformer搭建轻量化的轨迹预测模型,实现场景时序空间特征提取与交互关系建模;其次,设计运动信息时序掩码、道路信息空间掩码、交互关系掩码3类掩码重建任务对模型进行自监督预训练,以提升模型对场景通用特征的提取能力;最后,以预训练权重为初始化参数在下游任务中进行监督学习微调。在Argoverse2 Motion Forecasting数据集的实验表明,模型在预训练任务中能够很好地重建出交通场景,引入自监督预训练能够有效提升预测精度和数据利用效率,且对不同预测任务具有通用性,在单目标轨迹预测与多目标轨迹预测任务上minFDE6指标分别提升3.3%与3.7%。
混合交通流下由于驾驶员意图的不确定性行驶轨迹将呈现多模态属性,为了提高安全性并实现个性化驾驶,本文提出一种基于环境车辆多模态轨迹预测的智能车轨迹规划算法。首先,结合图卷积神经网络(GCN)和长短期记忆网络(LSTM)并加入注意力机制建立轨迹预测模型,预测不同行驶意图下的未来轨迹概率分布。然后,针对环境车辆的多意图概率下预测轨迹集合,根据自动驾驶风格偏好,设定一定的概率阈值挑选出确信轨迹,将其投影到规划路径上生成S-T图,并通过动态规划和二次规划进行基于碰撞风险规避的速度规划。最后,基于模型预测控制(MPC)对本文模型在典型换道场景和NGSIM真实道路场景下进行仿真测试并与现有模型进行对比验证。结果表明:本文提出的模型在安全性、舒适性和行车效率等方面均优于对比模型,能够在准确预测环境车辆未来轨迹的前提下实现最优轨迹规划,保证自动驾驶汽车安全、高效的行驶。
为完善复杂道路场景下智能驾驶车辆的碰撞风险评估方法,实时生成有效避险轨迹,本文提出了一种基于时空风险的智能驾驶车辆避险决策规划方法。首先,采用时空耦合的多域风险度量作为评估指标,监督智能驾驶车辆横纵向碰撞风险,同时实时监测行车风险指标变化,通过与典型避险场景风险数据库间的相关性分析,判断潜在碰撞风险大小,从而提前规避风险。然后,依据行车风险场对车辆目标状态进行不均匀采样,规避行车风险较高的驾驶区域,提高避险规划的安全性和实时性。试验结果表明,所提出的避险决策规划方法可安全有效地避开横纵向碰撞风险,并且根据风险指标的时域相关性分析可提前0.5 s发现潜在碰撞风险,从而提前平稳规避风险,不均匀采样可将避险轨迹平均规划时间由0.13 缩短到0.07 s。
高速公路换道决策问题场景复杂、不确定性强、实时性要求高,是国内外自动驾驶领域的研究热点和难点。深度强化学习(deep reinforcement learning,DRL)具有良好的决策实时性和面向复杂场景的适应性,然而,在训练样本与成本有限的条件下学习效果有限,其难以保证最优的驾驶效率和完全的行驶安全性。本文提出了一种基于改进DRL的混合专家模型(DRL-mixture of expert,DRL-MOE)换道决策方法。首先,模型的上层分类器根据输入状态特征动态地决定下层DRL专家或启发式专家的激活状态。为提高DRL专家的学习效果,本方法通过行为克隆(behavior cloning,BC)对神经网络参数进行初始化,对传统深度确定性策略梯度算法(deep deterministic policy gradient,DDPG)进行了改进。将智能驾驶员模型和最小化换道引起的总制动策略设计为启发式专家,以确保行驶安全性。仿真结果表明,本文所提出的DRL-MOE模型方法与非混合专家型DRL方法相比,在驾驶效率方面提高了15.04%,并确保了零碰撞和零出界,具有较高的鲁棒性和更优的效果。
为解决传统基于V2V通信的两车协同换道对于前方交通存在未知交通情况,及周围车辆信息获知不准确情况下换道成功率低且无法保证交通效率最优的问题,本文提出了一种基于场景划分的ICV两阶段协同换道避障方法。首先,将换道过程划分为纵向间距调整阶段与横向换道阶段,分别使用四次多项式与五次多项式描述两个阶段ICV的轨迹;其次,根据纵向间距调整结束时刻车辆的相对位置设计了4种场景,并设计以车辆调整末速度、距离与换道时间为目标函数的换道模型,在保证换道成功率的同时减少换道行为对上游交通产生的影响;最后,为了验证算法的有效性,在4种场景下分别设计可行工况,并对间距调整过程进行速度-时间与距离-时间关系图进行分析,证明间距调整过程均满足安全约束;同时,本文通过遍历循环计算换道避障算法的边界值,说明了ICV换道避障成功率与车间距、车辆与障碍物间距之间具有相关性。
为推动智能网联汽车应用落地,提出高速公路混合交通环境下智能网联汽车换道策略。首先,改进NaSch元胞自动机模型,并采用马尔科夫链算法计算道路通行能力;其次,针对目标车道为专用车道和普通车道分别建立基于车速引导的决策模型和基于博弈论的双矩阵决策模型;最后,采用多目标轨迹优化算法优化换道轨迹。结果表明:目标车道为专用车道和普通车道时,所提出的策略可分别提高换道效率6%、3.38%。
行车风险预测对提升智能汽车行车安全性至关重要,为此本文提出了一种跟驰工况下的行车风险预测模型(car-following risk prediction model, CRPM)。跟驰中车辆的减速能够反映驾驶人的认知风险,故根据车辆纵向加速度标注跟驰风险等级,并构建基于各向异性行车风险场的风险时空分布特征以用作CRPM的输入。CRPM通过卷积神经网络提取风险的空间分布特性,利用双向长短期记忆网络和注意力机制处理风险的时序依赖关系,最终输出跟驰风险等级。CRPM在航拍数据集AD4CHE上进行训练和测试。结果表明,CRPM具有良好的预测精度和提前预测时间,预测准确率达99.67%,在风险发生前2 s预测准确率为96.73%。
近年来,考虑安全与效率的自动驾驶矿车路径规划方法已逐渐成熟,并在多种矿山场景落地应用。与此同时,产业界和学术界也开始关注如何利用路径规划提升矿车的燃油经济性。针对这一需求,本文提出了一种矿山场景下的自动驾驶矿车节能路径规划方法,其主要特点是根据车速、道路坡度及障碍物进行S-L(进度-偏离)和S-T(进度-时间)的复合动态采样。针对矿山典型地形场景,建立了矿车燃油消耗指标,提出了安全性-运行效率-能耗综合路径评价模型;为了防止评价模型的各项权重陷入局部最优,设计了基于模拟退火策略的粒子群自适应优化方法。在矿山实际场景的测试中,本研究提出方法较现有方法在燃油经济性指标上平均提升了11.28%。
半挂车辆的非稳定运动学特性为其泊车过程中自主运动规划带来严峻挑战。针对半挂车在多障碍物的静态场景中泊车运动规划算法效率低、结果平滑性差等问题,本文提出了序列式运动规划方法(sequential motion planning algorithm, SMPA)。首先,提出了基于二次规划策略和改进双向快速扩展随机树(bidirectional rapidly-exploring random tree algorithm,Bi-RRT)的初始路径生成方法。然后,结合车辆非完整微分约束下的路径节点可行性判别方法研究,提出基于概率的目标偏向采样策略,提高了采样效率。最后,构建了面向车辆系统控制变量连续性的非线性最优化控制模型,解决泊车换向点的对接问题,提高了泊车轨迹平滑性。仿真结果表明,该方法在多障碍物场景中,规划时间相比Hybrid A*和Bi-RRT分别降低了86.71%和21.44%,轨迹质量也更具优越性。
智能车在动态环境中的轨迹规划须具备良好的舒适性及安全性,离散采样轨迹规划算法具有实时性高、多目标最优等优点而被广泛研究和应用,但在仿真及实车测试中发现,典型的基于多项式优化求解的离散采样局部轨迹规划结果在换道等瞬态过程存在一致性较差的问题。本文针对性提出一种考虑一致性评价的“拼接+强规划”轨迹规划算法。具体而言,根据自车状态截取历史轨迹为当前周期拼接轨迹,结合拼接轨迹和轨迹末状态采样点生成基于多项式的候选轨迹簇作为轨迹强规划阶段,再基于轨迹横向偏差设计轨迹一致性评价函数以从轨迹簇中选取较高一致性的最优行驶轨迹。经仿真和真实道路场景实车验证,表明所提出的轨迹规划方法在满足轨迹安全性、平顺性、舒适性要求的基础上提高了智能驾驶车辆行驶轨迹的整体一致性。