摘要
随着互联网时代的不断发展,社交网络已经成为人们获取信息的重要渠道之一。然而,社交媒体上存在大量虚假信息,这些信息可能会给人们带来误导和不良影响,甚至危害社会稳定。因此,如何利用计算机准确检测社交媒体中的虚假信息成为近年热点研究。当前,社交媒体上的谣言检测通常依赖于人工方法,需要耗费大量的人力、物力和财力,同时需要专家具有一定的知识储备。为了解决这个问题,学者们致力于研究一种自动谣言检测模型。现有模型虽然在一定程度上提高了检测的准确性,但忽略了事件与事件之间的关联关系。因此,本文提出了一种基于深度学习模型的检测方法,并设计实现一个微博谣言检测系统。本文主要工作如下: (1)针对事件源文本信息单一问题,提出了交叉注意力融合源文本和评论文本的谣言检测模型CROSS_SC。首先,对源文本以及评论文本预训练,转成计算机可以识别、处理的数据形式。其次,源文本使用TextRNN模型提取特征向量,同时评论文本使用TextCNN模型提取特征向量。之后,将两种文本的特征向量进行交叉注意力融合,得到两个新的特征向量,拼接得到事件的表征向量,使得事件信息更加丰富的同时为下一步工作做铺垫。最后,将事件表征向量引入全连接层作为独立整体进行谣言检测任务。 (2)针对社交网络中事件并非孤立存在的现象,提出了基于图神经网络的谣言检测模型CROSS_SC_GAT。该方法使用上述事件表征向量作为节点特征向量,使其节点特征向量含有丰富的语义信息。同时,事件间通过是否存在相同的评论者或转发者来构建事件关联图的边,即节点邻接矩阵,从而提高事件之间的相关性、更加准确的捕捉事件之间的联系。之后,将事件的表征向量和邻接矩阵输入到图注意力网络中,以输出事件节点的分类结果。 (3)为了方便用户操作和结果展示,设计并实现了一个原型系统。微博谣言检测系统采用B/S架构,使用Django框架。该系统包括用户登录,谣言检测,数据扩充三个模块。用户登录模块使用OAuth2协议实现第三方登录,用户成功登录后,系统将获取其个人信息并在界面中显示。谣言检测模块是本系统的核心模块,它将上述模型嵌入到系统中,为用户提供谣言检测功能。数据扩充模块通过爬取新浪微博数据,并将数据存储到数据库中,以便用于训练模型,从而提高谣言检测的准确率。