摘要
为提高混合动力汽车的燃油经济性,利用深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法优化自适应等效能耗最小策略(adaptive equivalent consumption mini-mization strategy,A-ECMS).在基于SOC反馈的基础上考虑上一时刻的需求功率、发动机和电机扭矩来调整等效因子,优化发动机与电机的扭矩输出,达到保持SOC和减少油耗的目的.由FTP75工况训练可知,提出的控制策略可以在原有的强化学习的能量管理策略的基础上用更短的时间学习到更好的控制动作,动作优化了6.05%,训练效率提升了60%,百公里等效油耗同基于规则相比减少了7.07%.在测试工况NEDC上的百公里等效油耗同基于规则能量管理策略相比油耗减少了2.27%,燃油经济性有明显改善.
基金项目
国家自然科学基金(51905061)
中国博士后科学基金(2020M671842)
重庆市自然科学基金(Cstc2019jcyj-msxmX0097)
重庆市教育委员会科学技术研究项目(KJQN201801124)
内燃机燃烧学国家重点实验室开放课题(K2019-02)