计算机研究与发展2021,Vol.58Issue(1) :60-69.DOI:10.7544/issn1000-1239202120190838

基于交叉摘的安全Tri-training算法

Safe Tri-training Algorithm Based on Cross Entropy

张永 陈蓉蓉 张晶
计算机研究与发展2021,Vol.58Issue(1) :60-69.DOI:10.7544/issn1000-1239202120190838

基于交叉摘的安全Tri-training算法

Safe Tri-training Algorithm Based on Cross Entropy

张永 1陈蓉蓉 1张晶1
扫码查看

作者信息

  • 1. 辽宁师范大学计算机与信息技术学院 辽宁大连116081
  • 折叠

摘要

半监督学习方法通过少量标记数据和大量未标记数据来提升学习性能.Tri-training是一种经典的基于分歧的半监督学习方法,但在学习过程中可能产生标记噪声问题为了减少Tri-training中的标记噪声对未标记数据的预测偏差,学习到更好的半监督分类模型,用交叉熵代替错误率以更好地反映模型预估结果和真实分布之间的差距,并结合凸优化方法来达到降低标记噪声的目的,保证模型效果在此基础上,分别提出了一种基于交叉熵的Tri-training算法、一个安全的Tri-training算法,以及一种基于交叉熵的安全Tri-training算法在UCI(University of California Irvine)机器学习库等基准数据集上验证了所提方法的有效性,并利用显著性检验从统计学的角度进一步验证了方法的性能.实验结果表明,提出的半监督学习方法在分类性能方面优于传统的Tri-training算法,其中基于交叉熵的安全Tri-training算法拥有更高的分类性能和泛化能力.

关键词

半监督学习/Tri-training算法/交叉熵/凸优化/样本标记

引用本文复制引用

基金项目

国家自然科学(61772252)

国家自然科学(61902165)

辽宁省高等学校创新人才支持计划项目(LR2017044)

辽宁省自然科学(2019-MS-216)

出版年

2021
计算机研究与发展
中国科学院计算技术研究所 中国计算机学会

计算机研究与发展

CSTPCDCSCD北大核心
影响因子:2.649
ISSN:1000-1239
被引量3
参考文献量3
段落导航相关论文