摘要
针对深度Q学习中单个Agent对行星齿轮箱进行故障诊断时出现的识别率低问题,利用多个Agent进行策略学习,结合模糊积分对多Agent的决策结果进行融合,提出了基于深度Q学习和模糊积分的行星齿轮箱故障诊断方法.对振动信号进行连续小波变换(continuous wavelet transform,CWT)、S变换(S transform,ST)得到相应的时频特征矩阵,随后利用原始时域数据和得到的时频特征矩阵构建多域环境状态空间,以与多个Agent交互;交互过程中将环境返回的原始时域特征、CWT时频特征,ST时频特征分别作为相应Agent的状态,通过深度Q学习算法最大化每个Agent的Q函数值,得到最优策略;采用模糊积分对多Agent的决策结果进行融合得到最终诊断结果.通过行星齿轮箱故障数据进行验证分析,经过模糊积分进行决策融合的诊断结果优于单个Agent,能够有效提高诊断精度.
基金项目
国家自然科学基金(51975079)
重庆市技术创新与应用示范项目(cstc2018jscx-msybX0012)
重庆市教育委员会科学技术研究项目(KJQN201900721)
交通工程应用机器人重庆市工程实验室开放基金(CELTEAR-KFKT-202002)
重庆市研究生导师团队建设项目(JDDSTD2018006)
重庆市北碚区科学技术局技术创新与应用示范项目(2020-6)