摘要
药物-靶标相互作用(DTI)的预测是研究和发现药物的关键步骤。药物-靶标相互作用的预测能够探索和识别药物与蛋白之前潜在关系的过程。与生化实验方法相比,传统的方法费力、耗时且极其昂贵,因为DTI可以有效识别潜在的DTI并且缩小生物学家和化学家的搜索空间。大多数预测DTI的传统方法,无论是用于药物发现还是重定位(将现有的药物重新用于新靶标)都是基于配体的方法。因此,准确有效的识别潜在的蛋白候选对于DTI至关重要。本文从药物和蛋白的多种属性信息出发,建立了三个预测模型来进行DTI任务的实现。各个预测模型均是利用了深度学习的预测方法,三个预测模型的实验结果证明,模型的预测性能均优于之前的一些预测方法。下面进行三个预测模型的简介以及完成的工作: 本文的三种预测模型均整合了药物和蛋白相关的多种属性信息,预测模型分别是基于属性对层面注意力和多通道卷积神经网络的预测模型(MAMCPred)、基于特征注意力的自动编码器和多模态相似性的预测模型(ASDTI)、基于随机游走和双向门控循环单元的预测模型(DTIP)。MAMCPred首先基于余弦相似性对药物的三种属性和蛋白的三种属性进行计算,得到规整的相似性矩阵。针对药物的多种相似性属性和蛋白的多种相似性属性,建立相应的相似性嵌入矩阵,随后建立了属性层面的注意力,学习的注意力分值赋予不同层面的药物,蛋白对不同的重要性。最后,一个多通道的卷积神经网络被提出,来对增强后的相似性嵌入矩阵进行深度的融合。融合后的相似性嵌入矩阵过一层全连接神经网络,得到药物和蛋白结点存在相互作用和没有互作关系的分值。为了验证模型的优越性,Amitriptyline,Asenapine,Amoxapine,Verapamil和Clozapine五个药物被做了案例分析,MAMCPred在一定程度上可以被用来筛选特定药物的候选蛋白。 ASDTI是一个基于特征注意力的自动编码器和药物、蛋白多模态相似性的预测模型。为了得到每个药物和每个蛋白的稠密并且具有信息性的低维的特征表示,首先将每个药物和每个蛋白的多种属性进行拼接操作,得到综合的特征。为了学习每个特征的表示,提出基于特征层面的注意力来学习更具代表性的特征表示。然后,全连接的自动编码器来对这些独特性的特征进行训练降维,为了使输出与输入更加贴切,自动编码器不断学习调整参数,来获得编码之后的低维特征表示。同时,先对药物和蛋白的多种矩阵进行余弦相似性计算,为了学习到每种相似性的差异,提出了相似性层面的注意力。经过注意力机制的药物、蛋白向量分别经过融合,得到综合的相似性嵌入对。然后将低维特征表示和相似性嵌入横向拼接,获得药物和蛋白对的表示。拼接后的表示对被投入到全连接神经网络,得到最后的预测得分。同样地,对Clozapine,Quetiapine,Aripiprazole,Olanzapine,Ziprasidone五个药物也进行了深入的案例研究,来验证ASDT1模型的性能。 基于随机游走和双向门控循环单元的预测模型DTIP中,首先利用药物结点、蛋白结点和疾病结点的特征层面的自动编码器,得到药物结点、蛋白结点和疾病结点的低维特征表示。然后针对药物结点和蛋白、疾病的关联关系,蛋白和疾病、药物的关联关系建立了三层异构网络。然后再这个异构网络中,从每个药物结点和每个蛋白结点出发进行随机游走的操作,得到每个药物结点和每个蛋白结点的邻居结点序列。双向门控循环单元学习这些序列中同种类型的结点的上下语义信息,随后邻居拓扑层面的注意力被提出来区分不同类型的邻居拓扑表示对于最终的互作预测的贡献,不同类型的拓扑被融合成最终的邻居拓扑表示。然后把邻居拓扑表示投进卷积神经网络和全连接神经网络来学习到最终的得分。在本章中,同样对五个药物进行了案例分析来验证模型的性能,这五个药物分别是Clozapine,Aripiprazole,Ziprasidone,Amitriptyline和Asenapine。分析表明,DTIP有发现潜在的蛋白候选的能力。