首页|基于特征组合与迁移学习的药物-靶标相互作用预测研究

基于特征组合与迁移学习的药物-靶标相互作用预测研究

扫码查看
预测药物-靶标相互作用是药物发现和药物重定位研究技术中的一个关键步骤,可以为药物研发和药物重定位提供分子层面上的科学依据,能够有效节省研发过程中生物实验投入的人力财力,缩短药物研发周期,具有重要的科学研究意义和实际的工程应用价值。 基因表达谱数据能反应人体细胞基因层面的表达水平,不同的药物刺激或者基因沉默会引发不同基因的异常表达。本文利用药物和靶标的基因表达谱数据,从药物和靶标的特征组合角度出发,结合FM模型的低阶特征组合特性和DNN模型学习高阶特征表示的能力,使用DeepFM模型进行药靶相互作用的预测。在此基础上,又提出了RNN-CNN混合模型,RNN能从药物和靶标整体特征上进行组合关系的学习,CNN能够学习药物和靶标特征在同个基因点上的线性组合。最后针对部分预测性能不足的模型,采用基于带权重域对抗网络的迁移学习方法对模型进行训练,将从其他细胞系学习到的知识,按照不同的程度迁移到目标细胞系,避免发生负迁移现象,提高预测模型的鲁棒性。 在实验阶段,本文使用LINCS和DrugBank数据集中的基因表达谱数据和药靶相互作用对,生成已知药靶相互作用对的正样本,以及药物与非靶标对的负样本,作为模型训练的数据集。实验结果表明本文提出的特征组合模型优于一般的机器学习方法,研究药物和靶标的特征组合关系能有效提高预测的准确性。此外本文提出利用迁移学习思想来提高部分模型的预测性能,在一定程度上能有效提高模型的预测鲁棒性,为小样本集的药靶相互作用问题提供了研究方向。

郑小平

展开 >

药靶相互作用 数据处理 特征组合 迁移学习 预测模型

硕士

计算机科学与技术

张仲楠

2019

厦门大学

中文

R9