摘要
现实世界中的许多场景都可以抽象成网络这种非欧几里得空间的数据。这些大规模的异质、动态网络统称为复杂网络。在传统的复杂网络分析研究中,节点的特征需要手动提取,很大程度上依赖于网络的类型、专家的经验和任务的类型。与之不同,网络表示学习能够自动学习一个映射函数来得到网络的有效表示,尽可能保留网络中丰富的信息。当前的网络表示学习研究存在诸多挑战:1)方法主要面向同质网络(即只有一种类型的节点和边)设计的,对于异质网络表示学习的研究还很不足;2)大多数方法假设网络的节点和边不会变化,然而现实网络往往是动态变化的;3)许多方法仅学习网络的拓扑结构信息,而忽略了对节点本身属性信息的融合。针对上述问题,本文系统性地进行了以下工作。 首先,本文将传统的同质网络表示学习方法拓展到异质网络上,提出了基于邻域影响力的异质图卷积(HIGCN)算法。该算法首先将异质网络根据元路径转化为多关系网络;然后叠加若干异质图卷积块(HIGCN block),每一层卷积块能够基于邻域节点的不同影响力同时聚合到属性和结构两种信息;最后通过1*1卷积融合不同语义关系(元路径)下的聚合信息。实验结果表明,HIGCN在所有的六个公开数据集上进行的三个任务(节点分类、链接预测、可视化)的性能均优于其它基线方法。 其次,本文为了提取网络中的动态信息,提出了动态变分自编码器(DVGAE)算法。该方法对GCN进行改进得到了时序图卷积,并在变分自编码器的框架下使用时序图卷积学习得到网络的表示。实验结果表明,该方法在两个动态网络数据集上的链接预测任务均优于其他基线方法。