在火电机组海量历史数据中,故障样本占比很低,数据样本分布非常不均衡.因此,常见的模糊聚类算法不能有效地识别故障类.本文在竞争聚类算法的基础上,提出一种改进算法,称为加权竞争聚类算法.该算法根据类间容量差异均衡化的思想,减弱大类对目标函数的贡献,防止较小类的聚类中心向大类靠拢,从而能均衡较大类和较小类对目标函数的贡献,改善算法处理不均衡数据集的聚类效果.为验证本文方法的有效性,在公共数据集上与其他聚类算法进行对比,并在包含故障集的空预器历史数据集上进行验证.结果表明,本文提出的加权竞争聚类算法在公共数据集及空预器历史数据集上都比竞争聚类算法有更好的识别效果.