摘要
随着环境污染与能源短缺等问题日益严峻,发展混合动力汽车成为解决环境和能源问题的有效途径。混合动力汽车关键技术之一是能量管理策略,其通过控制发动机与电机的功率分配从而提高车辆的性能,实现各动力源之间高效合理的工作。本文以某混合动力商用车为研究对象,建立发动机、电机等车辆动力系统模型,基于整车动力模型采用深度强化学习算法(DeepReinforcementLearning,DRL)搭建混合动力商用车能量管理策略实现动力源转矩的合理分配。主要的研究内容如下: 1.分析P2混合动力商用车动力系统结构,建立整车纵向动力学模型,基于台架试验的试验数据建立发动机与电机模型等关键部件模型,并通过仿真软件Cruise建立整车模型并验证了所搭建模型的合理性,为后续仿真奠定基础。 2.提出基于DRL的混合动力商用车的能量管理控制策略。将DRL应用到能量管理分配问题中,以电池的SOC、需求转矩(Tereq)、车速(V)以及加速度(a)为状态变量;以发动机输出转矩(Teice)为动作变量,并构建相应的状态动作空间;以整车的燃油经济性和SOC稳定为目标,完成基于DRL的混合动力商用车的能量管理策略设计;并对比分析基于双深度Q网络算法(DoubleQ-Learning,DDQN)、深度确定性策略梯度算法(DeepDeterministicPolicyGradientDeep,DDPG)、双延迟深度确定性策略梯度算法(TwinDelayedDeepDeterministicpolicygradientalgorithm,TD3)的能量管理策略,基于NEDC、CLTC-C工况下进行仿真试验,仿真结果表明,在NEDC工况下,基于TD3策略的等效油耗最低,比基于DDQN策略提高5.19%,比DDPG策略提高2.65%。同样,在CLTC-C工况下,基于TD3策略相较于其他两种策略,燃油经济性都有所提高,分别提高了5.29%和2.64%。验证了所提出的策略可以有效的提高整车的燃油经济性。 3.针对实际行驶时,工况随机性对能量管理策略的影响,提出一种考虑工况预测的DRL能量管理控制策略。阐述指数预测、随机预测和神经网络预测三种工况预测模型的基本原理,并根据三种预测模型进行仿真试验,通过仿真结果分析,选取神经网络算法对工况进行预测。根据预测结果,修正整车需求转矩,并将修正后的需求转矩作为状态变量引入TD3策略中,仿真结果表明,工况预测的引入使燃油消耗显著减小且可适用于不同的行驶工况。 4.基于dSPACE实时仿真系统完成硬件在环试验。基于dSPACE针对混合动力系统设计硬件在环仿真平台,将本文所设计的控制策略下载至控制器中,并与基于动态规划的(DynamicProgramming,DP)控制策略进行对比,通过硬件在环试验可知,考虑工况预测的TD3策略相比原策略等效油耗降低2.83%,验证了所提出策略的有效性与良好的燃油经济性。