首页|一种结合Focal Loss的不平衡数据集提升树分类算法

一种结合Focal Loss的不平衡数据集提升树分类算法

扫码查看
针对不平衡数据集分类问题中存在的难易样本不平衡问题,提出在提升树算法的基础上结合Focal Loss的不平衡数据集分类算法.分别在HTRU3、Yeast3、Test的不平衡数据集上对该算法与Borderline-SMOTE结合梯度提升树算法进行比较.实验结果表明,在HTRU2数据集上,该算法F1-score最高为0.970,而Border⁃line-SMOTE结合梯度提升树算法为0.972,虽然分类性能没有得到明显提升,但该算法仅需13次迭代便可收敛,而传统梯度提升树算法则需20次以上迭代才能收敛.在提升树模型中引入Focal Loss损失函数可有效提升模型收敛速度,且在一定程度上保持了模型分类性能.
A Boosting Tree Classification Algorithm for Imbalanced Dataset Combined with Focal Loss

朱翌民、郭茹燕、巨家骥、张帅、张维

展开 >

上海工程技术大学电子电气工程学院,上海201620

不平衡数据集 难分样本 易分样本 Focal Loss 梯度提升算法

国家自然科学基金青年基金国家自然科学基金青年基金上海市松江区科学技术攻关项目江西省经济犯罪侦查与防控技术协同创新中心开放基金

616032426180225119SJKJGG83JXJZXTCX-030

2021

软件导刊
湖北省信息学会

软件导刊

影响因子:0.524
ISSN:1672-7800
年,卷(期):2021.20(11)
  • 3
  • 13