计算机时代2023,Issue(6) :92-95,102.DOI:10.16644/j.cnki.cn33-1094/tp.2023.06.019

基于词嵌入和BiLCNN-Attention混合模型的政务文本分类方法

Method of government text classification based on word embedding and BiLCNN-Attention hybrid model

胡文烨 许鸿奎 郭旭斌 赵京政
计算机时代2023,Issue(6) :92-95,102.DOI:10.16644/j.cnki.cn33-1094/tp.2023.06.019

基于词嵌入和BiLCNN-Attention混合模型的政务文本分类方法

Method of government text classification based on word embedding and BiLCNN-Attention hybrid model

胡文烨 1许鸿奎 2郭旭斌 1赵京政1
扫码查看

作者信息

  • 1. 山东建筑大学信息与电气工程学院,山东 济南 250000
  • 2. 山东建筑大学信息与电气工程学院,山东 济南 250000;山东省智能建筑重点实验室
  • 折叠

摘要

针对政务文本分析语境复杂、分类准确率低的问题,提出基于BERT词嵌入和BiLCNN-Attention混合模型的文本分类方法.首先采用BERT模型对政务文本进行词嵌入向量表示,然后混合使用双向长短时记忆网络BiLSTM和卷积神经网络CNN,同时引入注意力机制进行特征提取,融合了时序特征及局部特征并使特征得到强化,最后使用Softmax进行文本分类.实验表明,BERT词嵌入处理后混合模型的准确率较CNN和BiLSTM模型分别提升了3.9%和2.51%.

关键词

政务文本分析/词嵌入/双向长短时记忆网络/卷积神经网络/注意力机制

引用本文复制引用

基金项目

山东省重大科技创新工程项目(2019JZZY010120)

山东省重点研发计划(2019GSF111054)

出版年

2023
计算机时代
浙江省计算技术研究所 浙江省计算机学会

计算机时代

影响因子:0.411
ISSN:1006-8228
参考文献量9
段落导航相关论文