首页|基于几何深度学习的蛋白质--配体结合位点预测算法研究

基于几何深度学习的蛋白质--配体结合位点预测算法研究

张仕卓

基于几何深度学习的蛋白质--配体结合位点预测算法研究

张仕卓1
扫码查看

作者信息

  • 1. 山东大学
  • 折叠

摘要

蛋白质-蛋白质和蛋白质-核酸相互作用是生物学中一种基本的分子相互作用形式,它们是重要的两类蛋白质-配体结合,对于细胞内的各种生物过程至关重要。其原理涉及到蛋白质和另一种生物分子之间的相互作用,通过分子间的非共价力或共价键形成稳定的结合。蛋白质和蛋白质相互作用通常发生在细胞内的信号传导、细胞周期调控、基因表达调控等生物过程中。蛋白质和核酸之间的交互作用对于控制基因的激活、信息的转录以及蛋白质的合成等关键过程发挥着核心作用。从蛋白质结构中预测蛋白质与蛋白质、蛋白质与核酸的相互作用位点,可以深入了解与蛋白质功能相关的生物学过程,为疾病诊断和新药设计提供关键技术指导。 在本文中,我们设计了一种端到端可解释的分层几何深度学习模型——GraphRBF。GraphRBF基于氨基酸邻域的空间化学排列来构建目标残基的局部邻域表示,从而确保平移和旋转不变性。我们先将蛋白质中每个氨基酸视作节点,氨基酸之间的相互影响视作连边,以此将蛋白质表示为图,然后我们构建了引入位置信息的增强型图神经网络作用于蛋白质图上,这使得我们可以基于图结构更新邻域内每个节点、边以及位置信息的特征。之后我们将邻域内的所有氨基酸视为点云结构并构建基于高斯核函数的径向基神经网络用于提取邻域的局部图特征,这使得我们可以直接从蛋白质的局部三维结构中提取特征,嵌入氨基酸的隐层特征表示。最后我们构建了多层神经网络并用提取到的图特征对目标残基进行结合位点的预测和分类。 在测试实验中,我们首先用蛋白质-蛋白质和蛋白质-RNA/DNA结合数据训练了GraphRBF,并测试了其预测蛋白质与三类生物大分子结合位点的能力。之后,我们对GraphRBF网络进行了可解释性分析,并通过多个实验对其进行了可视化。实验结果表明,与目前最先进的结合位点识别方法相比,GraphRBF方法表现出了非常明显的优越性,而且,GraphRBF能够学习与结合位点相关的重要物理化学特征,这充分验证了模型的可解释性。总之,GraphRBF是一种通用且可解释的模型,适用于识别多功能结合位点,有望为蛋白质位点相关疾病治疗和药物设计提供重要的技术支持。

关键词

蛋白质-配体/结合位点预测/几何深度学习/径向基神经网络

引用本文复制引用

授予学位

硕士

学科专业

运筹学与控制论

导师

柳军涛

学位年度

2024

学位授予单位

山东大学

语种

中文

中图分类号

Q5
段落导航相关论文