摘要
随着工业生产过程日益复杂,生产规模不断扩大,保证运行过程的安全性如今已是一项具有挑战性的任务。因此,故障诊断成为确保工业系统安全运行和降低维护成本的重要工具。值得注意的是,在工业系统的运行过程中,正常状态持续的时间往往远超过故障状态的时间,因此收集到的故障状态数据相对较少,导致数据集呈现严重的不平衡特性。另外,工业过程数据变量互联耦合,如何有效地提取变量间的相关性信息参与故障诊断成为提高诊断准确率的关键。本文针对不平衡数据环境开展基于数据增强的故障诊断方法研究。主要研究内容包含以下几个部分: (1)针对工业过程数据的不平衡问题,本文提出一种基于区域识别条件生成对抗网络的数据增强方法(AreaIdentificationConditionalGenerativeAdversarialNetwork,AICGAN)。首先,采用线性合成对原始数据进行初步过采样,得到预处理数据集。根据邻域内同类样本的分布密度来判断分布区域,为每个样本增加分布区域标签,得到扩展标签集。其次,在AICGAN的判别器中添加辅助分类层和辅助区域识别层,使用预处理训练集和扩展标签集训练AICGAN。最后,采用AICGAN的生成器在故障信息稀缺的分布区域生成新样本,使数据集达到平衡。 (2)考虑到工业过程数据的变量间具有相关性,且在数据增强过程中存在噪声,本文提出了一种基于图卷积收缩网络的数据分类模型(GraphConvolutionalShrinkageNetwork,GCSN)。首先,计算变量之间的皮尔逊相关系数来确定数据的图结构。然后,提出了一种新型的图卷积收缩层,其能够自适应确定噪声过滤阈值,用于提取图结构信息。该层先通过图卷积核提取特征,再利用由软阈值函数和全连接层组成的软阈值收缩层进行噪声过滤。最后,采用读出层、全连接层和Softmax层进行数据分类。 (3)在三相流设备(Three-phaseFlowFacility,TFF)数据集和田纳西-伊士曼(TennesseeEastman,TE)过程数据集上验证了所提出的故障诊断方法AICGAN-GCSN。实验结果表明,在不平衡数据环境下,基于AICGAN-GCSN的方法比其他方法获得了更高的准确率。