首页|融合语义增强的中文短文本分类方法研究

融合语义增强的中文短文本分类方法研究

扫码查看
中文短文本具有长度短以及上下文依赖强的特点.目前主流的基于词向量的双向循环神经网络分类方法依赖于词向量语义表达以及上下文特征提取能力,其分类准确率有待进一步改善.针对此问题,论文提出融合语义增强的中文短文本分类方法,该方法提出融合语义增强的思想,在词向量表示阶段,引入Bert生成融合字、文本以及位置的向量作为训练文本的词表征进行文本语义增强,接着输送到Bi-GRU网络中提取上下文关系特征,并通过多头注意力机制调整权值强化重要特征表达,最后使用softmax分类器进行文本分类.通过与其他主流方法进行对比论证,实验表明,论文提出的方法在短文本分类效果上有显著提升.
Research on Chinese Short Text Classification Method Based on Semantic Enhancement

潘袁湘、黄林、牛新征

展开 >

电子科技大学信息与软件工程学院 成都 610000

国网四川省电力公司信息通信公司 成都 610015

电子科技大学计算机科学与工程学院 成都 610000

短文本分类 Bert 语义增强 Bi-GRU网络 多头注意力机制

国网四川省电力公司信息通信公司项目

SGSCXT00XGJS1800219

2022

计算机与数字工程
中国船舶重工集团公司第七0九研究所

计算机与数字工程

CSTPCD
影响因子:0.355
ISSN:1672-9722
年,卷(期):2022.50(3)
  • 5