基于分层Attention机制的Bi-GRU中文文本分类模型

扫码查看

原文链接

NETL
NSTL
万方数据

中文摘要：针对基于神经网络的文本分类模型在训练过程中容易发生过拟合及忽略句子中的关键词的问题,提出了一种基于分层Attention机制的Bi-GRU中文文本分类模型.该模型引入了分层的思想,利用双向门控循环神经网络学习词层面和句子层面的文本表示,采用Self-Attention层次模型获取词和句子对于文本分类影响程度的信息;通过绑定共享嵌入层和softmax层之间的权重,在减少模型中参数的同时采用AMSBound优化方法快速有效地获取最优权重矩阵.对常用的两个中文数据集Fudan Set和THUCNews,本文模型对中文较长文本分类数据集Fudan Set进行实验,实验结果表明,本文模型在精度、召回率、F-score等指标上均优于Text-CNN模型、Attention-BiLSTM模型、Bi-GRU_CNN模型,精度、召回率、F-score指标分别提高了5.9％、5.8％、4.6％.

外文标题：Bi-GRU Model Based on Hierarchy Attention for Chinese Text Classification

作者：

胡玉兰、赵青杉、牛永洁、陈莉

展开 >

作者单位：

忻州师范学院计算机系,山西忻州034000

延安大学数学与计算机科学学院,陕西延安716000

西北大学信息科学与技术学院,陕西西安710127

关键词：

中文文本分类双向门控循环单元分层注意力机制权重绑定自适应边界梯度优化法

基金：

国家重点研发项目

项目编号：

2017YFB1402103-1

出版年：

2021

长春师范大学学报(自然科学版)

长春师范学院

长春师范大学学报(自然科学版)

影响因子：0.279

ISSN：1008-178X

年,卷(期)：2021.40(1)

参考文献量7