首页|基于平滑采样和改进损失的不平衡文本分类

基于平滑采样和改进损失的不平衡文本分类

扫码查看
在不平衡数据下,文本分类模型容易把样本数量较少的类别错分成数量较多的类别.在采样层面上提出一种平滑采样方法,在损失函数层面上根据不平衡分布改进交叉熵损失和标签平滑.复旦文本数据集上的实验表明,每种层面的改进都较基准模型有一定提高.当结合使用采样和损失函数的改进时,TextCNN、BiLSTM+At-tention、TextRCNN和HAN模型在宏平均F1值上分别提高4.17%、5.13%、5.06%和6.21%,在G-mean上分别提高6.56%、3.03%、3.92%和5.32%,较好解决了不平衡数据下文本分类任务.
Unbalanced Text Classification Based on Smooth Sampling and Improved Loss

梁健力、商豪

展开 >

湖北工业大学理学院,湖北武汉430068

文本分类 不平衡比例 平滑采样 损失函数

2023

湖北工业大学学报
湖北工业大学

湖北工业大学学报

CHSSCD
影响因子:0.258
ISSN:1003-4684
年,卷(期):2023.38(2)
  • 21