摘要
利用大规模的带标签数据集训练神经网络在分类任务中表现出色,但是实际使用的数据集中通常包含噪声标签从而使得分类网络的性能变差.为了克服噪声标签的不利影响,提出了一种基于多轮修正噪声标签的神经网络分类框架.该方法在每一轮修正中均更新训练的网络参数并修正当前训练数据中的噪声标签,修正后的数据集用于下一轮训练和修正.具体而言,在每一轮修正中首先利用本轮的数据集训练网络,并利用"锚点样本"的网络预测值估计数据集的标签转移矩阵;然后计算数据集的加权平均噪声率;之后结合加权平均噪声率和数据样本的训练损失值依据"小损失"原则筛选出噪声标签;最后利用标签转移矩阵和网络预测值对噪声标签进行自适应修正.经多轮修正可有效地降低数据集的噪声水平,从而使得训练出的分类网络更加准确.在多个真实数据集上的实验结果表明,该方法与现有的方案相比有较大的性能提升.
基金项目
江苏省重点研发计划(BE2020084-1)
国家自然科学基金(2018)(61801240)
江苏省高等学校"青蓝工程"中青年学术带头人项目(2019)(QL00219001)