摘要
随着网络用户规模日益扩大,以新浪微博为代表的在线社交网络平台逐渐成为了最重要的舆论传播平台。在线社交平台的庞大规模和交互特性,使得网络舆情的传播速度与范围远超传统舆情。及时有效地发现网络舆情中的意见领袖,对于有关部门开展舆情分析与引导工作,避免网络舆情恶化造成不良社会影响具有重要的现实意义。已有的意见领袖发现方法大都集中于部分数据指标,而较少考虑用户在舆情中表现出的情感特征。针对这一现象,本文提出一种基于正文情感特征的意见领袖发现方法CISC和一种基于评论情感特征的意见领袖发现方法CISC+。这两种方法综合考虑用户在不同方面的影响力特征,并分别引入了用户发帖的正文内容和评论内容的情感特征,通过聚类实现网络舆情意见领袖的发现。实验证明CISC和CISC+均可以有效发现部分被传统方法忽略的意见领袖,其发现结果均具有统计学显著性,且能够描述意见领袖在网络舆情中的实际表现。除提出了CISC和CISC+外,本文还构建了一个全新的新浪微博舆情数据集,包括超过8万条文本数据和超过6万名用户的个人资料数据,可以广泛用于舆情分析领域和自然语言处理领域的相关研究。