摘要
自然界中风能资源丰富,风力发电过程对环境友好。近年来我国的风电产业发展飞速,风电机组运行的稳定性也变得尤为重要。然而机组故障的发生会对设备的稳定运行及人员的安全产生巨大威胁,影响生产效率,因此开展故障诊断研究具有重要的现实意义。针对实际运行中风电机组故障数据较少、各类型故障样本不平衡的问题,传统方法难以实现有效的故障诊断。基于数据驱动的机器学习算法能够处理复杂非线性的故障数据,具有自适应地分析提取信息、对专业知识的依赖性较低、可实现智能分类等优点,为风电机组故障诊断提供了有效手段。其中CNN算法以较强的信息提取能力受到了极大关注,XGBoost算法对数据规模的依赖性较低且效率高,是目前机器学习中的热门算法。本文分别将CNN和XGBoost算法应用到了风电机组故障诊断研究中,主要内容如下: (1)在仔细了解风电机组运行原理与SCADA系统组成的基础上,深入分析了本文涉及到的主要故障类型。根据故障诊断的应用背景确立了评价标准,构建故障数据集并研究了故障特征之问的关系,故障数据集具有不平衡且规模较小的特点。 (2)针对故障数据集的不平衡性,本文在SMOTE算法的基础上提出了一种改进的卷积神经网络(TS-1DCNN)。利用一维CNN建立适用于序列数据的故障诊断模型(1DCNN),并借助SMOTE过采样方法对数据集的不平衡性进行处理。在1DCNN的基础上对结构进行优化,搭建具有不同尺寸卷积核的TS-1DCNN模型,对风电机组的主要故障进行诊断。 (3)针对故障数据集较小的特点,本文在ReliefF和SMOTE算法的基础上利用XGBoost算法建立故障诊断模型。借助ReliefF算法进行特征选择,减小冗余信息对XGBoost的干扰。借助SMOTE算法对故障数据集的部分少数类进行适量过采样扩充后,利用XGBoost对风电机组的主要故障进行诊断。 (4)仿真验证分析。首先通过仿真证明了基于CNN的方法中数据平衡处理的必要性,并对卷积核尺寸大小和结构优化的影响进行分析;其次在基于XGBoost的故障诊断中对特征选择与部分扩充方法进行仿真,分析了参数选择对准确率的影响。在复杂且不平衡的小样本故障数据集中,基于XGBoost的故障诊断方法具有更高的准确率,仿真证明了本文所提方法的有效性与工程实用性。