基于深度强化学习的网联自动驾驶汽车安全驾驶决策模型研究

高彩虹¹

扫码查看

作者信息

1. 北京交通大学
折叠

摘要

随着经济社会的快速发展，道路容量无法满足日益增长的交通需求，进而产生大量的交通拥堵，在这种环境下，车辆在跟驰和换道过程中的不稳定性往往会触发交通震荡现象，进而导致交通事故频发。深度强化学习技术凭借其在感知复杂环境和动态决策方面的优势，被广泛应用于控制网联自动驾驶汽车（ConnectedAutonomousVehicle,CAV）的行为来改善交通性能。因此，本研究采用了深度强化学习来开发安全驾驶决策模型，专注于路段跟驰、信号交叉口跟驰以及强制换道这几个关键场景，旨在优化CAV的行为策略，缓解车辆在跟驰和换道过程中产生的交通震荡现象，从而提升驾驶安全性。本文的主要研究内容如下: (1）以路段为研究场景，通过分析现有研究在缓解交通震荡方面的局限性，提出了基于Newell模型的深度强化学习驾驶策略。本论文考虑的是一排人类驾驶车辆被一辆CAV尾随，然后后面跟着一排人类驾驶车辆的仿真环境。在策略实施过程中利用Newell模型实时推测前排人类驾驶车辆产生的震荡传播的最低边界，并将其纳入深度强化学习的奖励函数设计中，以便控制CAV在震荡传播的最低边界之外行驶。实验结果表明相比于基准模型，该策略在缓解震荡和提升驾驶安全性方面展现出了明显的优势。（2）以信号交叉口为研究场景，通过分析现有研究应用在混合交通流中产生“轨迹波动”现象的原因，提出了基于震荡预测的多主体轨迹控制模型，该方法的核心思想是通过预测震荡，分析前车队引发的震荡影响，基于此，将CAVs分为两类不同的主体，并对它们实施差异化控制策略。实验结果表明，在应对人类驾驶车辆与CAVs随机混合通过信号交叉口的场景中，该方法可以有效减少“轨迹波动”现象，达到缓解交通震荡的目标，并显著提升驾驶安全性。（3）在强制换道场景下研究了车辆换道行为引发交通震荡现象的原因。基于原因分析，并在考虑换道过程的基础上，提出了基于拥堵吸收驾驶（Jam-AbsorptionDriving,JAD）策略的深度强化学习控制模型，该模型对CAVs进行两阶段的控制，在非换道区域内，利用JAD策略拉开车辆间距，在换道区域内，利用深度强化学习控制车辆进行安全换道。实验结果表明该模型可以有效缓解车辆在强制换道场景下产生的交通震荡现象，提高换道过程的安全性。本文针对路段跟驰场景、信号交叉口跟驰场景和强制换道场景，提出的基于深度强化学习的安全驾驶决策模型，能够有效控制CAV的行为决策，减少车辆的轨迹和速度波动，从而显著提升行驶安全性。

关键词

交通震荡/交通安全/深度学习/网联自动驾驶汽车/安全驾驶决策模型

引用本文复制引用

授予学位

硕士

学科专业

安全科学与工程

导师

王子洋

学位年度

2024

学位授予单位

北京交通大学

语种

中文

中图分类号

段落导航