首页|基于多组学数据的癌症协同驱动通路识别方法研究与应用

基于多组学数据的癌症协同驱动通路识别方法研究与应用

陈希

基于多组学数据的癌症协同驱动通路识别方法研究与应用

陈希1
扫码查看

作者信息

  • 1. 山东大学
  • 折叠

摘要

从大规模癌症多组学数据中识别促使癌症发生的关键驱动因素是对致癌机制进行深入探索的关键,有助于帮助研究者实现对癌症的精准诊断,靶向药物的快速开发和对临床病例的个性化治疗。早期的研究主要筛选显著高频突变的基因作为驱动基因,但这种方法受环境影响较大且缺乏普适性。驱动基因通常聚集形成通路,协同的驱动癌症的发生。通路间也通常通过协作,共同驱动正常细胞的致癌转化过程,因此识别协同驱动通路成为了当前癌症研究的重点。已有多种方法被提出,但它们仍存在过于依赖批量测序数据导致易受噪声影响、对除基因相关数据外的其他重要癌症数据利用不足、格式不统一难以进行比较分析等问题。因此,开发更高效的方法,并整合多种方法形成驱动通路识别系统仍具有重要的意义。 针对现有方法通常只使用批量数据,忽视了细胞水平上的异质性的问题,本文提出了一种基于单细胞和癌症亚型数据的方法CDMFinder。该方法首先利用基因在不同亚型及正常细胞表达数据间存在的特异性共表达信息,融合基因交互网络,优化形成分子功能关联网络,在深入挖掘基因间功能关联的同时有效降低网络复杂度;再基于重叠马尔可夫聚类从该网络中挖掘功能簇,并提出基于融合权重和贪心策略的驱动通路识别方法,从功能簇中获得驱动通路集;最后,融合功能交互网络与突变共现定义通路距离函数,识别获取协同驱动通路。CDMFinder充分融合评估了表达、突变、差异分析等多种因素,展现了优良的识别性能。 针对现有方法主要使用基因组学数据,忽略了已知通路信息和其他重要多组学数据,本文提出了CDPMiner以通过复杂网络嵌入联合建模多类型分子的关系和属性信息来发现协同驱动通路。CDPMiner首先使用通路拓扑来量化通路中不同基因的权重,并优化基因和通路之间的关系。然后,它构建了一个由miRNA、lncRNA、基因和通路组成的属性复杂网络,通过深度联合矩阵分解嵌入网络,为通路水平分析挖掘更多重要信息,并重建通路相互作用网络。最后,CDPMiner利用重构的网络和突变数据来定义通路地驱动权重,以发现协同驱动通路。CDPMiner能有效地融合多组学数据,以发现更多和更优秀的驱动通路,这些驱动通路确实协同触发癌症,辅助癌症致病机制解析。 针对现有方法通常使用不同语言开发,所用的数据格式和结果呈现方式也不同从而导致研究者难以方便快捷的对不同方法识别的驱动通路进行对比和分析的问题,本文对多种现有方法进行了统一的重构和调优,整合形成了协同驱动通路在线识别系统CDPTool,并提供了可视化的结果展现形式,为领域内研究者提供便利。

关键词

在线识别系统/多组学数据/马尔可夫聚类/癌症诊断/驱动通路

引用本文复制引用

授予学位

硕士

学科专业

软件工程

导师

王峻;余国先

学位年度

2023

学位授予单位

山东大学

语种

中文

中图分类号

TP
段落导航相关论文