现代计算机(普及版)2015,Issue(4) :14-20.DOI:10.3969/j.issn.1007-1423.2015.11.003

利用互信息和聚类抽样的文本情感分类

Text Sentiment Classification Based on Mutual Information and Cluster Sampling

陈智 李鹏
现代计算机(普及版)2015,Issue(4) :14-20.DOI:10.3969/j.issn.1007-1423.2015.11.003

利用互信息和聚类抽样的文本情感分类

Text Sentiment Classification Based on Mutual Information and Cluster Sampling

陈智 1李鹏2
扫码查看

作者信息

  • 1. 武汉科技大学计算机科学与技术学院,武汉 430065
  • 2. 武汉科技大学计算机科学与技术学院,武汉 430065;智能信息处理与实时工业系统湖北省重点实验室,武汉 430065
  • 折叠

摘要

为了将文本情感划分更细的类别,提出一种利用互信息和聚类抽样的文本情感分类方法,对文本进行分词和特征提取的预处理,通过聚类抽样得到的情感标签之间的互信息,组合情感标签的互信息得到情感类别,并根据互信息调整特征词库的权重,最后利用中心性度量综合得出该文本情感的类别.实验通过不同的文本情感分类方式对分类结果进行比较,实验表明,该分类方法优于其他分类方法,从而验证该方法的有效性.

Abstract

To divide the text sentiment into finer categories,proposes a text sentiment classification method by using mutual information and cluster sampling.Uses the text pre-processing for text segmentation and feature extraction,and calculates the mutual information of each sentiment tag by cluster sampling.Obtains sentiment categories by combination of sentiment tags,and adjusts the weight of key word by mutual information.Derives the text sentiment classification by using center metric.Compares different text sentiment classification in the experiment.The results show that the proposed classification method outperforms other classification methods and verify the effectiveness of the proposed method.

关键词

互信息/聚类抽样/情感标签/文本情感分类

Key words

Mutual Information/Cluster Sampling/Sentiment Tag/Text Sentiment Classification

引用本文复制引用

基金项目

武汉科技大学大学生科技创新基金(13ZRC071)

出版年

2015
现代计算机(普及版)
中山大学

现代计算机(普及版)

影响因子:0.202
ISSN:1007-1423
被引量1
参考文献量3
段落导航相关论文