摘要
分子性质预测是一项长期受到关注并具有重要意义的工作,具有较高的研究潜力和实用价值,因此不仅限于材料科学领域,在食品开发、药物研发、材料合成等领域也受到广泛的关注。但是传统的基于密度泛函理论(Densityfunctionaltheory,DFT)的方法由于需要极大的计算量和复杂的计算过程,难以进行大规模的数据集运算。近年来,随着神经网络理论的日趋成熟和计算设备性能的大幅提高,应用神经网络的深度学习技术在各个领域中均显示出了巨大的价值和潜力。由于现实世界中存在着大量的非欧式空间数据,以及卷积神经网络的流行,图卷积神经网络(GraphConvolutionalNetwork,GCN)应运而生,在诸如分子性质预测等任务上表现出色。GCN通过基于每个节点的邻居信息进行递归式的更新每个节点的表示向量,在高度结构化的图数据上取得了很好的效果。然而,传统的GCN并非处理复杂分子预测任务的最优解,原因在于分子中不同的化学键上包含了大量的诸如键长、键能等信息,而传统GCN会将它们视为完全相同的边。此外,分子作为一种三维结构,具有二维平面所无法表达的结构特性,如何将这种结构特性融入到分子性质的工作当中去以提升预测效果,也是受到关注的问题。总体来说,我们提出的方法通过增强边信息表达和更好的利用分子的三维结构信息两方面来构建用于分子性质预测的神经网络。本文的主要研究成果如下: (1)为了增强边信息的表达,我们提出了可根据边特征学习更新的邻接矩阵。与其他典型的图结构数据(如社交网络,地图结构数据等)相比,分子结构中的边信息(即化学键)包含有更复杂,且对分子整体性质影响较大的,诸如键长,键类型,键能等信息。为了充分利用到分子结构中每个化学键上所包含的复杂信息,我们引入了新的、由边特征学习而来的可变邻接矩阵取代标准GCN结构中固定的邻接矩阵,在网络迭代学习的过程中同时学习原子(点)和化学键(边)上所包含的信息,进而充分利用到每个化学键上所包含的丰富信息。 (2)为了更好的利用分子的三维结构信息,我们引入3D-GCN与注意力机制。通过将分子中原子关系进行多次映射,并自适应适配网络构建多个图注意力网络(Graphattentionnetwork,GAT),从而在高维空间中学习分子的立体结构信息。相比于传统的平面结构图网络,减少了由立体结构映射到平面结构的信息缺失,从而获取到更加准确的诸如键长、键夹角等在二维平面上无法得到准确表达的结构信息。最后我们把两个网络结合共同预测以促进模型达到最优。实验表明,改进后的新的邻接矩阵在迭代学习过程中对于特定的边表现出明显的倾向性,同时多次映射可以在多个空间学习到不同的复杂关系,有利于模型预测的提升。实验表明,我们设计的网络结构在公开分子结构数据集(QM9)上表现出整体优于标准的GCN、GAT,同时在多个指标上优于现有的GCN网络变体关系图卷积网络(RelationalGraphAttentionNetworks,RGCN)和消息传递神经网络(MessagePassingneuralnetworks,MPNNs)。