首页|基于社交网络的用户主题建模以及信息流行度预测研究

基于社交网络的用户主题建模以及信息流行度预测研究

胡杰

基于社交网络的用户主题建模以及信息流行度预测研究

胡杰1
扫码查看

作者信息

  • 1. 杭州电子科技大学
  • 折叠

摘要

近年来,随着互联网的兴起,Facebook,Twitter,新浪微博等社交平台的崛起,大量社交用户在这些平台上发表内容,抒发情感。社交网络的流行产生了大量时间序列数据,其中蕴含了用户在社交环境下的意见、看法等。各个社交平台为了争夺彼此之间的市场份额,除了更加注重内容的多样化外,也在模式上积极寻求创新和突破。社交网络应用的核心竞争力在于优质的原创内容以及拥有大量粉丝的头部用户所带来的传播效应与流量收益,这些需要平台对用户需求和信息流行度的把控相当精准。围绕这些问题,针对社交网络中用户主题建模和流行度预测进行的相关研究如下: (1)针对用户主题建模问题提出一种权重主题模型。研究表明,社交网络中存在“被动用户”,这些用户不会将兴趣爱好以文本内容形式呈现,并且数量逐渐增多。传统的主题模型聚焦于用户的短文本和个人属性,在预测“被动用户”主题信息上准确度较低。为了更好地挖掘用户的隐藏主题,通过探讨分析影响主题挖掘的各种因素,结合友邻关系在用户聚类和社区发现上的应用,提出一种基于社交结构的主题预测模型(DWTM)。DWTM将用户的社交信息、用户属性信息以及文本信息转换成每部分对应的系数,并利用融合策略将三种系数整合到统一的主题模型框架中。最终在文本分析的基础上构建基于社交结构的主题预测模型。实验结果表明,所提主题模型相较于目前的其他算法性能提高了15%左右。 (2)考虑到社交平台具有很强的异质性,传统的时间序列模型无法很好地捕捉各个社交网络的流行度模式,首次提出串行化的时间序列混合模型。在社交网络的背景下,模型利用自回归移动平均识别流行度线性结构,然后对残差进行延时嵌入,并使用支持向量回归捕捉残差之间的非线性关系。针对社交网络的异质性导致模型泛化性能降低问题,模型在残差序列预测中加入时滞选择,利用离散粒子群优化算法,使社交平台可以根据自己的特性动态地选择时滞序列,解决了不同的社交网络对于时滞性的依赖差异问题。在四种真实的社交网络数据集中与前人的算法进行对比,结果表明,所提流行度预测模型在性能上比最新的混合方法要好33.06%,与单一模型相比更是提升了58.83%。

关键词

社交网络/用户主题建模/流行度预测/混合模型/时滞选择

引用本文复制引用

授予学位

硕士

学科专业

计算机科学与技术

导师

徐向华

学位年度

2021

学位授予单位

杭州电子科技大学

语种

中文

中图分类号

TP
段落导航相关论文