摘要
过程监测是指监控过程行为,及时发现过程中的故障,并对其进行恢复,对工业过程安全可靠运行具有重要意义。故障分类属于过程监测方法的一部分,对检测到的故障进行分类。在实际的工业生产过程中,由于对故障数据的类别进行标注是耗时而昂贵的,需要过程领域的专业知识,因此往往只有少量的有标签样本,这使得利用无标签样本构建半监督的故障分类方法成为必要。 考虑到深度学习强大的特征提取能力和在无标签数据上的学习能力,本课题重点研究了基于半监督深度学习的故障分类方法,主要研究内容如下: (1)针对传统的自编码器模型在微调时只使用有标签数据而导致的泛化能力弱、容易过拟合等问题,提出了一种基于特征对齐自编码器的半监督故障分类方法。特征对齐自编码器在微调时对有标签数据和无标签数据通过自编码器提取的特征进行对齐。实验证明,所提出的模型相对于传统的自编码器方法具有更佳的泛化能力,有效地减少了缺少有标签样本导致的过拟合现象。 (2)许多半监督学习算法都假设有标签样本和无标签样本属于同一分布,然而无标签故障数据没有经过专家筛选标注,工业过程有时也会发生工况飘移和噪声,上述假设很难保证,而这会导致半监督算法的性能下降。本文提出了一种基于鲁棒特征对齐自编码器的半监督故障分类方法,它先对与有标签样本分布不一致的无标签样本进行过滤或者降权,再进行后续建模,这有效地提升了模型的鲁棒性,减少了有标签无标签样本分布不一致造成的模型性能下降问题。 (3)预训练能够充分利用无标签样本,帮助半监督学习。然而工业过程现有的预训练方法较少,且单一预训练方法存在局限性。本文提出了一种基于集成预训练模型的半监督故障分类方法,采用集成学习结合多种动态预训练模型的优势,预训练能够同时提升基学习器性能和它们之间的差异性。方法中采用一种互为老师的方式对无标签样本进行学习,并且证明了这种方式的合理性。