首页|基于多模态特征融合的社交网络信息流行度预测方法研究

基于多模态特征融合的社交网络信息流行度预测方法研究

王凯

基于多模态特征融合的社交网络信息流行度预测方法研究

王凯1
扫码查看

作者信息

  • 1. 中国科学技术大学
  • 折叠

摘要

社交网络信息流行度预测是指在信息发布之前依据其本身内容以及相关用户等信息来对其未来的流行度进行预测,该任务可以为信息在社交网络平台中传播扩散提供诸多的解释,相关研究技术也可以广泛应用于舆情监测、网络营销和广告推荐等领域。随着深度学习的快速发展,社交网络信息流行度预测任务最近几年已经取得了突破性的进展,但是在事前预测中,仍然面临着以下问题和挑战:流行度的影响因素多样性和建模方法的有效性。流行度不仅与信息内容本身相关,还与信息内容整体一致性、用户、发布时间等多种因素有一定的关联,并且信息之间也有一定的潜在关联现象,如何对这些所有相关因素建模挖掘是一难点;此外,在对动态流行度序列预测中,如何缓解时序模型引入的误差累积现象,如何建模高效的动态流行度序列预测算法也是一大难点。为此,针对以上问题和难点,本文展开了相关研究,主要的研究工作如下: 1.针对流行度的影响因素多样性问题,对相关影响因素建模挖掘,本文提出了一种基于图文一致性和短期关联的社交网络信息未来时刻的流行度预测算法。通过深度学习技术对图像和文本内容进行多层次内容特征挖掘和相关的用户特征挖掘之外,基于社交网络信息本身固有现象,引入信息内容的整体一致性分析和用户信息序列的短期潜在关联挖掘。具体来说,为了挖掘信息内容的整体一致性关系,引入联合学习的Transformer网络来对图像和文本内容联合建模,获取图文内容的匹配程度以及联合特征表示;为了挖掘用户信息序列的短期潜在关联,提出一种基于时间间隔的时序模块对信息序列整体分析,对内容特征再处理关联融合。本文提出的算法在真实的流行度预测公开数据集上与其他现有方法对比,结果验证了本文提出的算法的有效性。 2.针对动态流行度序列预测中的建模方法,尤其是时序模型预测引起的误差累积问题,本文提出了一种基于增长走势的社交网络信息动态流行度序列预测算法。该算法将动态序列预测问题转化为流行度的增长走势预测和流行度的规模预测两个子问题。具体来说,通过引入聚类算法对社交网络信息传播的增长走势聚类,使其聚类中心作为信息传播的增长走势原型,对于挖掘后的多模态内容特征和用户特征设计增长走势分类器和流行度规模回归器,使其结果恢复为原始动态流行度序列。此外,设计流行度规模标准化方法缓解离群值预测中引起的巨大误差。本文在动态流行度序列预测公开数据集上展开了大量实验,结果表明了该算法框架的有效性。 3.开发部署了社交网络信息流行度预测实际应用系统。基于采集于微博平台的社交网络信息数据,以及流行度的传播规模预测和流行度的增长走势预测的实际问题,以及基于上述流行度预测问题的研究成果,本文设计实现了一个社交网络信息流行度预测系统,部署于服务器用于提供可视化交互和在线服务。

关键词

社交网络信息/流行度预测/多模态特征融合/深度学习

引用本文复制引用

授予学位

硕士

学科专业

网络空间安全

导师

毛震东

学位年度

2022

学位授予单位

中国科学技术大学

语种

中文

中图分类号

TP
段落导航相关论文