首页|基于无信息先验分布的可解释变分图自编码器方法研究

基于无信息先验分布的可解释变分图自编码器方法研究

扫码查看
互联网的普及促进了复杂网络的发展,如何学习一个低维稠密的向量来表征复杂网络中的节点以便进行分析成为了一个研究重点。变分图自编码器凭借其强大的生成能力已经成为复杂网络表征的常用方法之一。然而目前变分图自编码器的研究存在两个挑战。1)已有的变分(图)自编码器及其变体大都假设隐变量服从标准正态先验或服从一个融入了很多专家经验的复杂先验,但是在很多实际情况中很难确定采用什么形式的先验或者先验概率很难获取。因此,如何在不引入额外专家知识的前提下,为隐变量设置一个合理的先验成为一项艰巨的任务。2)近年来基于图神经网络的模型在处理复杂网络方面取得了巨大的成功。然而这类方法通常是一个黑盒,使得学得的低维表示无法解释。提高图神经网络模型的可解释性可以增加人们对算法预测结果的信任以及及时纠正模型出现的系统错误。因此,如何提高模型的可解释性越来越成为一个热门的科学课题。考虑到以上两个挑战,本文的创新点主要包含以下内容: (1)提出了一种新的基于无信息先验分布的可解释变分图自编码器模型(NPEVGAE)。首次利用无信息先验的思想来改善变分图自编码器中隐变量的先验知识缺失问题,实现了在缺乏先验知识时为隐变量选择一个合适先验的目的。该模型突破了隐变量后验分布必须趋向于标准正态先验这一不切实际的限制,采用一种不随参数形式变化而变化的无信息先验分布作为隐变量的先验概率。该模型不再鼓励学得的隐表示聚集在原点,而是鼓励后验分布从输入数据中学习模型的参数,因此能够充分利用隐空间。本文通过详细的分析证明了无信息先验会对后验概率参数的学习造成很小的干扰,从而说明了无信息先验分布选取的合理性。 (2)本文模型NPEVGAE提供了一种新的视角来理解节点的隐表示,提高了模型本身的可解释性。NPEVGAE将节点表示的每个维度视作节点隶属于每个块的软分配概率,使得节点表示变得可解释。同时节点所属的块之间的关系由块和块之间的相关度矩阵来刻画。在恢复图结构时,不仅考虑节点学得的表示,而且也考虑节点所属的块之间的相关程度,从而使得属于同一个块的节点有更大的概率相连。 (3)本文选取了几种先进的网络表示学习算法作为对比算法,在链接预测和半监督节点分类任务上进行的大量实验验证了本文提出的基于无信息先验的可解释变分图自编码器模型的优越性和效率。最后通过可视化工具直观展示了本文模型能够有效地区分不同类别的节点并且能充分利用潜在空间。

孙丽丽

展开 >

图神经网络 模型解释 网络表示学习 变分图自编码器 无信息先验分布

硕士

软件工程

杨博

2021

吉林大学

中文

TP