基于深度强化学习的混合动力商用车能量管理策略研究

王天佑¹

扫码查看

作者信息

1. 河南科技大学
折叠

摘要

随着环境污染与能源短缺等问题日益严峻，发展混合动力汽车成为解决环境和能源问题的有效途径。混合动力汽车关键技术之一是能量管理策略，其通过控制发动机与电机的功率分配从而提高车辆的性能，实现各动力源之间高效合理的工作。本文以某混合动力商用车为研究对象，建立发动机、电机等车辆动力系统模型，基于整车动力模型采用深度强化学习算法（DeepReinforcementLearning，DRL）搭建混合动力商用车能量管理策略实现动力源转矩的合理分配。主要的研究内容如下： 1.分析P2混合动力商用车动力系统结构，建立整车纵向动力学模型，基于台架试验的试验数据建立发动机与电机模型等关键部件模型，并通过仿真软件Cruise建立整车模型并验证了所搭建模型的合理性，为后续仿真奠定基础。 2.提出基于DRL的混合动力商用车的能量管理控制策略。将DRL应用到能量管理分配问题中，以电池的SOC、需求转矩（Tereq）、车速（V）以及加速度（a）为状态变量；以发动机输出转矩（Teice）为动作变量，并构建相应的状态动作空间；以整车的燃油经济性和SOC稳定为目标，完成基于DRL的混合动力商用车的能量管理策略设计；并对比分析基于双深度Q网络算法（DoubleQ-Learning，DDQN）、深度确定性策略梯度算法（DeepDeterministicPolicyGradientDeep，DDPG）、双延迟深度确定性策略梯度算法（TwinDelayedDeepDeterministicpolicygradientalgorithm，TD3）的能量管理策略，基于NEDC、CLTC-C工况下进行仿真试验，仿真结果表明，在NEDC工况下，基于TD3策略的等效油耗最低，比基于DDQN策略提高5.19%，比DDPG策略提高2.65%。同样，在CLTC-C工况下，基于TD3策略相较于其他两种策略，燃油经济性都有所提高，分别提高了5.29%和2.64%。验证了所提出的策略可以有效的提高整车的燃油经济性。 3.针对实际行驶时，工况随机性对能量管理策略的影响，提出一种考虑工况预测的DRL能量管理控制策略。阐述指数预测、随机预测和神经网络预测三种工况预测模型的基本原理，并根据三种预测模型进行仿真试验，通过仿真结果分析，选取神经网络算法对工况进行预测。根据预测结果，修正整车需求转矩，并将修正后的需求转矩作为状态变量引入TD3策略中，仿真结果表明，工况预测的引入使燃油消耗显著减小且可适用于不同的行驶工况。 4.基于dSPACE实时仿真系统完成硬件在环试验。基于dSPACE针对混合动力系统设计硬件在环仿真平台，将本文所设计的控制策略下载至控制器中，并与基于动态规划的（DynamicProgramming，DP）控制策略进行对比，通过硬件在环试验可知，考虑工况预测的TD3策略相比原策略等效油耗降低2.83%，验证了所提出策略的有效性与良好的燃油经济性。

关键词

混合动力商用车/能量管理策略/深度强化学习

引用本文复制引用

授予学位

硕士

学科专业

车辆工程

导师

高建平/郗建国/罗本进

学位年度

2023

学位授予单位

河南科技大学

语种

中文

中图分类号

段落导航