基于深度学习的微博谣言检测系统设计与实现

张倩¹

扫码查看

作者信息

1. 曲阜师范大学
折叠

摘要

随着互联网时代的不断发展，社交网络已经成为人们获取信息的重要渠道之一。然而,社交媒体上存在大量虚假信息，这些信息可能会给人们带来误导和不良影响，甚至危害社会稳定。因此，如何利用计算机准确检测社交媒体中的虚假信息成为近年热点研究。当前，社交媒体上的谣言检测通常依赖于人工方法，需要耗费大量的人力、物力和财力，同时需要专家具有一定的知识储备。为了解决这个问题，学者们致力于研究一种自动谣言检测模型。现有模型虽然在一定程度上提高了检测的准确性，但忽略了事件与事件之间的关联关系。因此，本文提出了一种基于深度学习模型的检测方法，并设计实现一个微博谣言检测系统。本文主要工作如下: (1)针对事件源文本信息单一问题，提出了交叉注意力融合源文本和评论文本的谣言检测模型CROSS_SC。首先，对源文本以及评论文本预训练，转成计算机可以识别、处理的数据形式。其次，源文本使用TextRNN模型提取特征向量，同时评论文本使用TextCNN模型提取特征向量。之后，将两种文本的特征向量进行交叉注意力融合，得到两个新的特征向量，拼接得到事件的表征向量，使得事件信息更加丰富的同时为下一步工作做铺垫。最后，将事件表征向量引入全连接层作为独立整体进行谣言检测任务。 (2)针对社交网络中事件并非孤立存在的现象，提出了基于图神经网络的谣言检测模型CROSS_SC_GAT。该方法使用上述事件表征向量作为节点特征向量，使其节点特征向量含有丰富的语义信息。同时，事件间通过是否存在相同的评论者或转发者来构建事件关联图的边，即节点邻接矩阵，从而提高事件之间的相关性、更加准确的捕捉事件之间的联系。之后，将事件的表征向量和邻接矩阵输入到图注意力网络中，以输出事件节点的分类结果。 (3)为了方便用户操作和结果展示，设计并实现了一个原型系统。微博谣言检测系统采用B/S架构，使用Django框架。该系统包括用户登录，谣言检测，数据扩充三个模块。用户登录模块使用OAuth2协议实现第三方登录，用户成功登录后，系统将获取其个人信息并在界面中显示。谣言检测模块是本系统的核心模块，它将上述模型嵌入到系统中，为用户提供谣言检测功能。数据扩充模块通过爬取新浪微博数据，并将数据存储到数据库中,以便用于训练模型，从而提高谣言检测的准确率。

关键词

谣言检测/社交网络/深度学习/注意力机制/Django框架

引用本文复制引用

授予学位

硕士

学科专业

计算机技术

导师

祝永志

学位年度

2023

学位授予单位

曲阜师范大学

语种

中文

中图分类号

段落导航