基于异构融合特征的深度强化学习自动驾驶决策方法

扫码查看

原文链接

国家科技期刊平台
NETL
NSTL
万方数据
维普

中文摘要：在自动驾驶决策方法中,传统模块化方法受限制于数据集的广泛性,基于强化学习的方法难以在高输入维度且动作空间连续的情况下有效学习.为了解决上述问题,提出了一种基于异构融合特征的深度强化学习自动驾驶决策方法,首先使用适量驾驶数据预训练图像降维网络,然后将降维后得到的图像特征和车辆状态特征进行异构融合作为强化学习的输入,采用深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)强化学习框架,通过为自动驾驶量身定制的综合了速度、方向盘角度、车辆位置、碰撞等信息的奖励函数有效引导学习,结合经验池回放技术和目标网络技术提高训练收敛速度.所提方法有效缩短了训练时间,并可在复杂城市环境下保持较高的稳定性与鲁棒性.

外文标题：Method of Deep Reinforcement Learning Autonomous Driving Strategy Based on Heterogeneous Fusion Features

作者：

冯天、石朝侠、王燕清

展开 >

作者单位：

南京理工大学计算机科学与工程学院南京 210094

南京晓庄学院信息工程学院南京 211171

关键词：

深度强化学习自动驾驶异构融合特征 DDPG 奖励函数

基金：

项目编号：

2016300TS00909161371040

出版年：

2022

DOI：

10.3969/j.issn.1672-9722.2022.09.011

计算机与数字工程

中国船舶重工集团公司第七0九研究所

计算机与数字工程

CSTPCD

影响因子：0.355

ISSN：1672-9722

年,卷(期)：2022.50(9)

参考文献量3