首页|基于机器学习的细胞系与药物反应预测研究

基于机器学习的细胞系与药物反应预测研究

李桂锦

基于机器学习的细胞系与药物反应预测研究

李桂锦1
扫码查看

作者信息

  • 1. 湖南师范大学
  • 折叠

摘要

基因组的特异性可能会导致罹患同样疾病的个体对于同样的药物有着不同的反应。因此,以个体基因组信息为依据的个性化治疗出现,而预测不同个体特定细胞系对相同药物的不同反应是个性化治疗中的核心问题。通过临床实验验证药物反应对实验设备要求高,需要投入大量时间和资金。随着高通量测序技术的发展,基于生物学数据,利用计算机算法建立模型对药物反应进行临床前预测具有重要的现实意义。本文应用机器学习技术,结合细胞系的组学信息,药物的化学结构信息以及细胞系与药物反应信息,构建出两种不同的药物反应预测模型。主要工作如下: (1)提出一种基于最大流和随机森林的药物反应预测模型(ADrugResponsePredictionmodelbasedonMaximumflowandRandomForest,Mflow_RFDRP)。Mflow_RFDRP从数据库中获得细胞系基因表达数据、药物化学结构数据以及已知的细胞系-药物反应数据,首先,对数据进行相似性度量处理,得到初始相似性网络;接着,引入最大流算法作为特征选择策略,分别得到细胞系和药物的特征,将其串联得到细胞系-药物对特征向量;最后,通过随机森林对细胞系-药物进行分类。 (2)提出一种基于最大流和卷积神经网络的药物反应预测模型(ADrugResponsePredictionmodelbasedonmaximumflowandConvolutionalNeuralNetworks,Mflow_CNNDRP)。Mflow_CNNDRP从数据库中获得细胞系的多组学数据,包括基因表达数据、基因突变数据、拷贝数变异数据,药物化学结构数据和已知的细胞系-药物反应数据,在此基础上重新构建了不同的相似性网络,采用最大流算法提取细胞系和药物的特征,最后建立9层卷积神经网络对细胞系-药物对的关系进行预测。 (3)将Mflow_RFDRP、Mflow_CNNDRP和已有的相似药物反应预测算法进行了对比测试。和已有的类似算法相比,大量实验结果表明Mflow_RFDRP和Mflow_CNNDRP具有较好的预测性能。Mflow_RFDRP和Mflow_CNNDRP在仅使用基因表达这种单组学数据时的预测性能不相上下,但Mflow_RFDRP运行时间远短于Mflow_CNNDRP;而Mflow_CNNDRP模型在处理多组学数据时,预测性能表现更好,但所需的时间也较长。

关键词

细胞系/药物反应/预测模型/机器学习

引用本文复制引用

授予学位

硕士

学科专业

软件工程

导师

谢民主

学位年度

2021

学位授予单位

湖南师范大学

语种

中文

中图分类号

R9
段落导航相关论文