摘要
社交媒体已经融入了人们的日常生活和工作中,在社会、经济等各方面扮演着重要角色。其庞大的用户群体催生了很多基于社交网络的业务,如病毒式营销、口碑营销等。这些应用依赖于信息在社交网络中的传播,因此如何寻找社交网络中最具影响的传播者,推动信息的广泛传播变得至关重要。这即是影响力最大化(Influence Maximization,IM)问题研究的核心,其中信息的初始传播者称为种子用户(节点)。单层网络中的IM问题已经得到了广泛的研究,不过这类研究忽略了社交网络的多重性。传统的社交网络采用二元建模方式,仅考虑用户之间是否存在交互关系,而忽略了交互关系的多样性和重要性。因此,多重网络(Multiplex Network)的建模方式更适合于描述复杂的现实情况。多重网络中的IM问题也更加复杂。 得益于网络表示学习方法的特征提取能力,近年来已有研究结合了该类方法来解决单层网络中的种子节点选择问题。而对于多重网络,这方面的研究还较少。此外,由于信息在网络中不是孤立的存在,其传播过程往往会受竞争和合作性信息的影响。因此在影响力传播过程考虑不同信息的影响也很有必要。鉴于以上情形,本文针对多重网络中的 IM 问题,从种子节点选取和影响力传播模型两个角度出发,分别从多重网络表示学习方法和多信息耦合传播模型展开研究。随后在这两方面研究的基础上对多重网络中的 IM 问题进行探讨。首先基于多重网络表示学习方法来解决种子节点选取问题;其次在多信息耦合传播研究的基础上,考虑了存在竞争和合作信息的影响力传播模型。本文的研究工作具体有以下几方面。 (1)提出了基于角色感知随机游走的网络表示学习方法。提出的方法可以灵活地捕获节点的社区信息和结构角色信息,以适应不同的下游任务。对于单层网络来说,通过角色层面的采样使得提出的方法可以适用于不同的网络结构,包括非连通网络。对于多重网络,通过角色感知随机游走,可以实现同层和跨层的上下文采样。基于此,结合 Skip-gram 模型,可以实现对单层网络和多重网络节点表示的学习,并在多个真实数据集的实验中证明了所提出方法的有效性。 (2)提出了一个统一的多重网络表示学习框架,纳入了多重网络中不同的结构信息。针对多重网络的表示学习,提出的方法能够将结构角色信息统一到一个学习框架中。使学到的节点表示除了能够保留节点近邻性外,还能保留节点间的结构相似性。进一步以半监督的方式,通过注意力机制来学习了节点在不同层表示的重要性。在多个公开数据集上,与基准方法的对比证明了所提出方法的有效性。同时消融实验也证明了结构角色信息对多重网络表示学习的增强作用。 (3)构建了多重网络中存在竞争与合作信息的耦合传播模型。提出的框架统一了竞争性和合作性耦合传播过程,在模型中同时考虑了竞争和合作信息的影响。通过微观马尔可夫链方法(Microscopic Markov Chain Approach, MMCA)对信息的理论阈值进行了分析,结合大量的数值模拟探讨了多重网络中的信息耦合传播过程。研究结果揭示了竞争信息和合作信息分别对目标信息的抑制作用和促进作用,同时也揭示了信息间的间接影响作用。该研究加深了对多重网络中信息耦合传播过程的理解,同时为考虑存在竞争和合作信息的影响力传播模型提供了理论基础。 (4)提出了基于多重网络表示学习的种子节点选择方法。在前文研究的基础上,提出了基于多重网络表示学习的逆转随机游走中心性。提出的方法首先使用多重网络表示学习算法来学习节点在不同层的表示,然后计算各层中节点间的相似性权重;基于相似性权重运行逆转随机游走,并统计每个节点被访问到的次数;最后实现 top-k 种子节点的选取。在影响力传播模型方面,不仅考虑了单影响力传播过程,还考虑了存在竞争和合作信息的传播模型。在不同的影响力传播模型下,多个数据集上的实验验证了所提出方法的有效性。