首页|基于异构融合特征的深度强化学习自动驾驶决策方法

基于异构融合特征的深度强化学习自动驾驶决策方法

扫码查看
在自动驾驶决策方法中,传统模块化方法受限制于数据集的广泛性,基于强化学习的方法难以在高输入维度且动作空间连续的情况下有效学习.为了解决上述问题,提出了一种基于异构融合特征的深度强化学习自动驾驶决策方法,首先使用适量驾驶数据预训练图像降维网络,然后将降维后得到的图像特征和车辆状态特征进行异构融合作为强化学习的输入,采用深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)强化学习框架,通过为自动驾驶量身定制的综合了速度、方向盘角度、车辆位置、碰撞等信息的奖励函数有效引导学习,结合经验池回放技术和目标网络技术提高训练收敛速度.所提方法有效缩短了训练时间,并可在复杂城市环境下保持较高的稳定性与鲁棒性.
Method of Deep Reinforcement Learning Autonomous Driving Strategy Based on Heterogeneous Fusion Features

冯天、石朝侠、王燕清

展开 >

南京理工大学计算机科学与工程学院 南京 210094

南京晓庄学院信息工程学院 南京 211171

深度强化学习 自动驾驶 异构融合特征 DDPG 奖励函数

2016300TS00909161371040

2022

计算机与数字工程
中国船舶重工集团公司第七0九研究所

计算机与数字工程

CSTPCD
影响因子:0.355
ISSN:1672-9722
年,卷(期):2022.50(9)
  • 3