摘要
在网络科学领域迅速发展的背景下,量化网络之间的结构相似性已成为一个重要且基本的问题,通过探究各种网络之间的共性与差异,从而深入了解网络的结构与特性。然而,真实世界中网络具有多样性和复杂性,为有效比较不同网络的结构相似性带来了巨大的挑战。传统的网络比较方法通常依赖于选取网络特定的拓扑性质和特定的度量方法来衡量网络之间的相似性,但这些方法在捕捉网络的整体结构信息时存在局限性,由于它们通常只关注网络特定的局部结构属性,忽略了真实网络当中所具有的高阶特性,导致在衡量网络相似性的效果上具有一定缺陷。为了克服这一限制,本文提出了基于高阶聚类系数以及模体的网络比较方法,旨在综合考虑网络的全局性质和局部拓扑结构对于网络比较问题的影响。本文的主要贡献如下: (1)在无向网络中,本文引入了网络节点的高阶聚类系数,该指标可以基于高阶特性捕捉网络中节点的聚集性,并进一步考虑节点与其高阶邻居之间的连接关系。然后,本文阐述了网络相似性距离公式,在所提出的算法中基于高阶聚类系数和最短路径分布的Jensen-Shannon散度来度量网络中节点之间的平均连通性,同时使用网络节点散度来区分节点的异质性。此外,在有向网络中,本文引入了网络模体概念,借助模体这一网络中最为常见的图形模式,来分析复杂的高阶拓扑性质和节点关联模式,为捕获网络的结构特征提供了更全面的视角。最后,通过基于模体的距离分布计算有向网络之间的相似性。 (2)为验证所提出方法的有效性,本文在人工合成网络和真实网络中进行了一系列相关实验。通过调节三种不同人工合成网络生成模型对应的参数,比较所提出方法在同一网络中不同参数下的差异性;基于网络的随机化程度生成了四种不同类型的网络模型,并在这四个模型上评估方法的有效性;同时,在人工合成网络中将本文所提出的方法与其他基线方法进行了对比,实验结果展示了该方法的准确性与稳定性。在真实网络中,本文选择了不同领域内的真实数据集,通过真实网络与扰动重构后的网络之间进行相似性比较,来验证所提出方法的可靠性;接着,在真实网络中通过零模型与原网络的对比分析,凸显了本文所提出的方法具有很强的鲁棒性与稳定性。最后,参数敏感性分析实验则表明了方法在不同类型与规模的网络中均能表现出良好的性能。 综上所述,本文提出了基于高阶聚类系数以及模体的网络比较方法,该方法同时兼顾了网络的全局性质与局部拓扑结构,并在人工合成网络和真实网络中相似性比较均表现优于基线方法。本文的算法模型在复杂网络分析和应用中具有广泛的潜在应用前景,为网络科学领域的进一步研究和实践提供新的思路与方向。