摘要
在“30-60双碳目标”的政策驱动下,我国的风电产业必将进入高速发展阶段。由于风电机组的内部结构复杂且所处环境恶劣,使得机组故障频发,造成发电量下降、运行维护成本增加。通过先进的自动化故障预警技术提前发现潜在故障并及时消除,能够有效节约维修成本,减少停机时间。为此,本文以获取成本低、测点类型丰富、记录时间长的数据采集与监视控制系统(SupervisoryControlandDataAcquisition,SCADA)数据作为数据源,研究基于正常行为建模的故障预警方法。实现流程包括数据处理、特征选择、数据驱动建模和残差分析四个环节。本文对每个环节进行深入研究,并提出相应的方法,研究内容如下: 第2章提出了基于密度聚类和边界提取的异常数据处理方法。数据处理环节是对原始数据中的空值、异常值进行去除,避免异常数据对数据驱动建模造成负面影响。异常数据通常分为三类:底部堆积异常点(Type1)、限功率异常点(Type2)和零散异常点(Type3)。根据Type1的分布特点和处理难点,结合机组在低风速下的运行模式,设计了一种直观规则法用于去除Type1异常点。根据Type2的分布特点和处理难点,设计了一种边界提取和边界规整相结合的处理方法,用于去除Type2异常点。根据Type3的分布特点和处理难点,对密度峰值聚类算法做了改进,并用于去除Type3异常点。为了避免各类异常点相互影响,在处理流程前端加入分区聚类提升整体处理效果。 第3章提出一种基于近邻元分析的特征变量选择方法。特征选择是从大量的测点变量中筛选出对数据驱动建模具有重要作用的关键特征变量,降低数据维度和模型复杂度。针对现有特征选择方法不适用于风电机组正常行为建模等问题,本章面向基于正常行为建模的风电机组故障预警,以近邻元回归算法为基础,提出一种特征变量选择方法。方法通过计算回归建模过程中每个变量的贡献率来确定重要度权值,在分析SCADA数据冗余变量特点的基础上,利用相关系数矩阵去除冗余变量。实验表明,提出方法的特征选择结果更加直观,能去除冗余变量,有助于提升故障预警效果。 数据驱动建模是采用正常状态的历史数据训练得到被监测部件的正常行为模型。残差分析是利用目标变量实测值和预测值之间的残差计算表征设备状态的故障预警指标。用于风电机组故障预警的正常行为模型主要分为单变量预测模型和多变量重构模型两类,二者应用场景不同,所以本文对基于两种模型的故障预警分别做了研究。 第4章在数据处理和特征选择的基础上,研究了单变量预测模型的数据驱动建模和残差分析环节。为了研究数据的时间、空间特征,使用自相关系数和偏自相关系数分析时间特征,验证了数据中存在多尺度短时相关性。结合润滑油冷却系统的工作原理,分析数据的长期时间特征和机组状态的关系,验证了数据中存在长期时间特征。使用最大信息系数分析空间特征,验证了数据中存在多尺度空间特征。针对上述时空特征,利用回声状态网络构成多尺度短时特征模块,利用门控循环单元(GateRecurrentUnit,GRU)构成长期特征模块,利用空洞卷积神经网络构成多尺度空间特征模块。将三个模块进行组合,提出了多尺度时空深度网络模型。在单变量预测残差的基础上,使用残差控制图和相对熵作为残差分析方法,实现故障预警。 第5章在数据处理和特征变量选择的基础上,研究了多变量重构模型的数据驱动建模和残差分析环节。针对现有多变量重构模型的时空特征学习能力较差、难以充分挖掘复杂SCADA数据的深层信息等不足,将双向长短期记忆神经网络(Bi-directionalLongShort-TermMemory,BiLSTM)和变分自编码网络(VariationalAutoEncoder,VAE)进行组合,提出一种BiLSTM-VAE多变量重构模型。该模型可以学习数据的时空特征,具有更好的重构性能。得到多变量重构残差后,如果对各残差变量逐一分析则工作量太大,需要进一步使用多变量残差分析方法计算出一个故障预警指标。然而现有多变量残差分析方法难以有效凸显异常趋势,针对该问题,提出一种变量分组马氏距离的预警指标计算方法。实现故障预警后,为了确定故障变量,需要进行故障隔离。针对现有方法未考虑残差变量间耦合影响等问题,提出一种基于随机森林的故障隔离方法。