长春师范大学学报(自然科学版)2021,Vol.40Issue(1) :39-45.

基于分层Attention机制的Bi-GRU中文文本分类模型

Bi-GRU Model Based on Hierarchy Attention for Chinese Text Classification

胡玉兰 赵青杉 牛永洁 陈莉
长春师范大学学报(自然科学版)2021,Vol.40Issue(1) :39-45.

基于分层Attention机制的Bi-GRU中文文本分类模型

Bi-GRU Model Based on Hierarchy Attention for Chinese Text Classification

胡玉兰 1赵青杉 1牛永洁 2陈莉3
扫码查看

作者信息

  • 1. 忻州师范学院计算机系,山西 忻州034000
  • 2. 延安大学数学与计算机科学学院,陕西 延安716000
  • 3. 西北大学信息科学与技术学院,陕西 西安710127
  • 折叠

摘要

针对基于神经网络的文本分类模型在训练过程中容易发生过拟合及忽略句子中的关键词的问题,提出了一种基于分层Attention机制的Bi-GRU中文文本分类模型.该模型引入了分层的思想,利用双向门控循环神经网络学习词层面和句子层面的文本表示,采用Self-Attention层次模型获取词和句子对于文本分类影响程度的信息;通过绑定共享嵌入层和softmax层之间的权重,在减少模型中参数的同时采用AMSBound优化方法快速有效地获取最优权重矩阵.对常用的两个中文数据集Fudan Set和THUCNews,本文模型对中文较长文本分类数据集Fudan Set进行实验,实验结果表明,本文模型在精度、召回率、F-score等指标上均优于Text-CNN模型、Attention-BiLSTM模型、Bi-GRU_CNN模型,精度、召回率、F-score指标分别提高了5.9%、5.8%、4.6%.

关键词

中文文本分类/双向门控循环单元/分层注意力机制/权重绑定/自适应边界梯度优化法

引用本文复制引用

基金项目

国家重点研发项目(2017YFB1402103-1)

出版年

2021
长春师范大学学报(自然科学版)
长春师范学院

长春师范大学学报(自然科学版)

影响因子:0.279
ISSN:1008-178X
参考文献量7
段落导航相关论文