科技与创新2021,Issue(13) :118-120,123.DOI:10.15913/j.cnki.kjycx.2021.13.051

基于双向编码表示预训练模型的舆情文本解析分类

金昊 王亚珅 李阳阳
科技与创新2021,Issue(13) :118-120,123.DOI:10.15913/j.cnki.kjycx.2021.13.051

基于双向编码表示预训练模型的舆情文本解析分类

金昊 1王亚珅 1李阳阳1
扫码查看

作者信息

  • 1. 中国电子科技集团公司电子科学研究院,北京 100041
  • 折叠

摘要

随着人工智能和大数据的不断发展,网络数据呈现爆炸式的增长,日益增长的庞大数据量给网络舆情监测分析带来了挑战,急需一种应对海量数据的文本分类算法来自动识别和分类舆情信息.提出一种基于双向编码表示(BERT,Bidirectional Encoder Representations from Transformers)预训练模型的舆情文本解析分类方法.首先将文本输入到词典编码器中;随后通过多层转换器编码将输入特征映射成为一个上下文关联的特征向量;最后为了捕获局部信息,使用卷积神经网络进一步编码并将编码后的信息输入到分类器预测舆情文本属性.

关键词

舆情文本解析/舆情文本分类/自然语言处理/机器学习

引用本文复制引用

基金项目

出版年

2021
科技与创新
中国计算机用户协会

科技与创新

ISSN:1008-0570
参考文献量1
段落导航相关论文