计算机应用研究2021,Vol.38Issue(11) :3283-3288.DOI:10.19734/j.issn.1001-3695.2021.04.0105

基于深度半监督的柬语句子级情感分类

Sentiment classification of Khmer sentences based on deep semi-supervised

李超 严馨 徐广义 莫源源 周枫
计算机应用研究2021,Vol.38Issue(11) :3283-3288.DOI:10.19734/j.issn.1001-3695.2021.04.0105

基于深度半监督的柬语句子级情感分类

Sentiment classification of Khmer sentences based on deep semi-supervised

李超 1严馨 1徐广义 2莫源源 3周枫4
扫码查看

作者信息

  • 1. 昆明理工大学信息工程与自动化学院,昆明650500;昆明理工大学云南省人工智能重点实验室,昆明650500
  • 2. 云南南天电子信息产业股份有限公司,昆明650040
  • 3. 云南民族大学东南亚语言文化学院,昆明650500;上海师范大学语言研究所,上海200234
  • 4. 昆明理工大学信息工程与自动化学院,昆明650500;昆明理工大学云南省人工智能重点实验室,昆明650500;上海师范大学语言研究所,上海200234
  • 折叠

摘要

针对柬语标注数据较少、语料稀缺,柬语句子级情感分析任务进步缓慢的问题,提出了一种基于深度半监督CNN(convolutional neural networks)的柬语句子级情感极性分类方法.该方法通过融合词典嵌入的分开卷积CNN模型,利用少量已有的柬语情感词典资源提升句子级情感分类任务性能.首先构建柬语句子词嵌入和词典嵌入,通过使用不同的卷积核对两部分嵌入分别进行卷积,将已有情感词典信息融入到CNN模型中去,经过最大延时池化得到最大输出特征,把两部分最大输出特征拼接后作为全连接层输入;然后通过结合半监督学习方法——时序组合模型,训练提出的深度神经网络模型,利用标注与未标注语料训练,降低对标注语料的需求,进一步提升模型情感分类的准确性.结果 证明,通过半监督方法时序组合模型训练,在人工标记数据相同的情况下,该方法相较于监督方法在柬语句子级情感分类任务上准确率提升了3.89%.

关键词

柬语句子级情感分类/情感词典嵌入/卷积神经网络/半监督/时序组合模型

引用本文复制引用

基金项目

国家自然科学基金资助项目(61462055)

国家自然科学基金资助项目(61562049)

出版年

2021
计算机应用研究
四川省电子计算机应用研究中心

计算机应用研究

CSTPCDCSCD北大核心
影响因子:0.93
ISSN:1001-3695
参考文献量2
段落导航相关论文