摘要
链路预测作为数据挖掘的一个分支,为复杂网络和信息科学的联系提供了桥梁。链路预测的一个重要目标是:实现信息科学中缺失信息的还原和预测。链路预测不仅在学术上推动了信息科学的发展,在实际应用中也具有巨大价值。随着社交网络的快速发展,链路预测方法在社交网络上的应用也越来越广泛。面对日趋大型化的社交网络,链路预测方法不仅需要保证足够高的预测精确度,还要考虑时间复杂度,现有的链路预测方法无法同时满足这两个需求,因此对链路预测方法的改进是非常有必要的。论文研究了社交网络中的链路预测,改进了基于局部信息的链路预测方法,主要工作及贡献包括: 1)结合网络的结构属性,对链路预测方法的预测精确度与网络结构属性的相关性进行研究。不同的链路预测方法对节点相似性的定义不同,因此它们在同一个复杂网络中的预测精确度有所不同,论文研究了复杂网络的平均度、聚类系数和同配性对预测精确度的影响,并设计实验对链路预测方法在实际网络中的预测精确度进行计算,验证了网络的结构属性与链路预测方法的预测精确度之间确实存在一定的相关性。 2)在相关性研究的基础上,分析了社交网络中存在的不同于其他类型网络的结构特性,并根据社交网络的“小世界”和无标度特性对链路预测方法进行改进,在基于局部路径的相似性方法基础上加入节点的度对节点相似性的贡献,通过实验验证了改进后的方法能够在不增加时间复杂度的情况下提高预测精确度。