摘要
近年来,随着网络技术的快速发展,各种社交媒体竞相出现,为用户提供新的社交途径,同时也加速网络中虚假信息的产生和传播,对社会和公众造成了不同程度的负面影响,因此需要采取有效的虚假信息识别措施净化社交网络环境。评价信息可信度是识别虚假信息的重要手段。然而,目前信息可信度的评价方法存在特征组合有效性低、评价准确度低等问题。本文以社交网络信息可信度为研究对象,针对信息可信度评价特征选取和评价方法两个具体问题展开研究,并提出基于D-S证据理论的多特征融合信息可信度评价方法,可进一步提高社交网络信息可信度评价准确度。本文主要工作如下: (1)针对目前信息可信度评价方法中的特征组合有效性低的问题,提出基于文本和图像两种模态的新的特征及特征组合。通过分析社交网络中信息的特点,发现虚假信息中存在大量标题与正文内容不一致的情形,由此提出标题-正文一致性特征并将其作为信息可信度评价的依据。进一步,在已有包含两种特征的组合中加入所提特征得到新的特征组合,即正文文本特征、图文一致性特征和标题-正文一致性特征的组合,并将该特征组合用于可信度评价任务中,最终在PolitiFact和GossipCop数据集上的实验结果表明,新的特征组合评价效果优于已有特征组合。 (2)针对现有基于深度学习的特征融合方法较依赖先验知识,且在特定的小样本数据集上评价精度低的问题,将基于D-S证据理论的信息融合方法引入信息可信度评价中,并结合所提新的特征组合,提出一种基于D-S证据理论多特征融合的社交网络信息可信度评价方法。该方法首先分别利用正文文本特征、图文一致性特征和标题-正文一致性特征进行信息可信度评价;继而将三种基于单一特征的可信度评价结果转换为证据,并使用改进的D-S证据理论融合规则做出融合和决策,最后输出可信度综合评价的最终结果。在中文微博数据集和英文PolitiFact数据集上的实验结果表明,所提方法能够较好地解决信息可信度评价任务。