首页|基于混合测序的基因组变异检测方法研究

基于混合测序的基因组变异检测方法研究

杨金晶

基于混合测序的基因组变异检测方法研究

杨金晶1
扫码查看

作者信息

  • 1. 东南大学
  • 折叠

摘要

基因组变异在人类基因组中普遍存在,导致了人与人之间截然不同的各类性状差异,也是引发部分疾病的重要因素。在基因组变异中,稀有变异(Rare Variants)是指单核苷酸变异中次等位基因频率(Minor Allele Frequency)小于0.5%的基因组变异;结构变异是指长度在50bp以上的DNA大片段的变异。随着测序技术的不断发展,基因组测序已经成为检测稀有变异与结构变异的主流方法。但由于稀有变异低等位基因频率的特性,稀有变异的检测往往需要对大规模样本进行测序,但传统测序方法需要对大量样本单独制备文库,在文库制备上需要耗费大量成本。为了解决大样本测序成本过高的问题,混合测序技术应运而生。而利用混合测序也可以解决结构变异检测问题。区别于传统结构变异检测方法通过获取长测序片段检测结构变异,重叠混合克隆测序通过获取个体的单倍型信息检测结构变异,为结构变异的检测提供了新的方法。 本论文主要围绕重叠混合测序检测稀有变异与结构变异的方法设计和性能检验展开研究。论文首先改进了重叠混合测序检测稀有变异方法。在现有重叠混合测序模型的基础上,建立了准确率更高的识别稀有变异携带者的解码方法,并在千人基因组数据集上评价了重叠混合测序检测稀有变异的性能,比较了传统测序方法与重叠混合测序方法的优劣。结果证明重叠混合测序方法可以在保证99%以上准确率的情况下,将测序成本降低到普通测序方法的50%以下,在大样本全基因组外显子规模的稀有变异检测方面具有明显优势。 其次,本论文建立了基于重叠混合克隆测序的基因组结构变异检测方法,通过分组重叠混合测序检测克隆从而获得个体的单倍型信息,并使用序列拼接方法与参考基因组进行对比寻找结构变异。我们在模拟数据集上验证了该模型的准确性,实验结果证明该方法不仅可以将测序成本降低到普通测序成本10%以下,更可以100%检测出模拟数据集中的结构变异,在全基因组结构变异的检测方面具有高准确率低成本的优势。 论文改进并设计了重叠混合测序检测稀有变异与结构变异的新方法,验证了方法的准确性,拓展了重叠混合测序的应用,并为稀有变异与结构变异的检测提供了新策略。

关键词

基因组变异检测/混合测序/稀有变异

引用本文复制引用

授予学位

硕士

学科专业

生物医学工程

导师

孙啸

学位年度

2019

学位授予单位

东南大学

语种

中文

中图分类号

R4
段落导航相关论文