电力行业是国民经济中的基础性产业,日益严重的电力异常行为给国家经济造成了巨大损失。XGBoost(eXtreme gradient boosting)算法用于异常客户的识别。首先,对原始数据进行清洗;然后,从不同角度构建用户用电特征;最后,使用XGBoost分类器分别在平衡样本集和非平衡样本集下进行异常客户识别。与之对比,在相同特征下,分别使用KNN(k-nearest neighbor)分类器、BP(back-propagation)神经网络分类器和和随机森林分类器在这两个样本集下进行异常客户识别。实验结果表明,XGBoost分类器有更高的识别率和更快的运行速度,特别是在不平衡数据集下,性能改进尤为明显。