首页|利用高通量测序技术和生物信息学分析人和动物病毒宏基因组与全基因组

利用高通量测序技术和生物信息学分析人和动物病毒宏基因组与全基因组

王媛媛

利用高通量测序技术和生物信息学分析人和动物病毒宏基因组与全基因组

王媛媛1
扫码查看

作者信息

  • 1. 安徽医科大学
  • 折叠

摘要

病毒在自然界中无处不在,它们不具有细胞结构,但是具有遗传、复制等生命特征,需要借助宿主细胞才能完成生命活动。病毒引起的疾病对人类和动植物构成重大威胁,从2003年影响全球的SARS非典型肺炎、2013年的寨卡(Zika)、2014年西非埃博拉到中东呼吸综合征(MERS)等等,造成了不同程度的重大公共卫生事件。监测病毒性疾病的出现和再次出现目的是遏制病毒的传播,需要既有足够的准备也要具备快速的检测反应。识别新疫情的致病因素是有效应对疾病爆发最重要的措施之一。传统上,病毒发现需要病毒在细胞培养中繁殖,经过验证的技术,识别的大多数病毒都是已知的。但是,很多病毒都不能很容易的在细胞培养中繁殖,病毒的分离也就无从下手,从而限制了我们对于病毒的理解和深入的病毒信息挖掘。 本研究利用高通量测序技术结合生物信息学对人类和动物(主要是虫媒病毒)病毒宏基因组和全基因组进行分析,对于临床上不明原因的发热病人或常规检测手段不能检测出的病原体,通过高通量测序技术筛查病原体;对样本进行一些前期处理,如病原体的浓缩和宿主核酸的去除等,虽浓缩效率有限以及不能完全去除宿主核酸,但能减少非目的病原体的干扰,提高检测效果。随着科学技术的飞速发展,高通量测序技术的特点是成本的降低,速度越来越快,通量越来越大,但是通量大就带来了海量测序数据的分析工作变得更加耗时费力,尤其是全基因组的组装以及如何从大数据量的测序结果中寻找和挖掘有价值的信息,这成为了巨大的挑战。本文运用实验室自主研发的高通量测序分析流程对已知和未知病毒进行生物信息学分析,首先将原始数据进行进行过滤以去除低质量序列和过短序列,然后对覆盖度进行均一化,目的是减少数据量为后续分析减少时间,继而将均一化的数据与病毒蛋白库比对,将其中的全部病毒序列提取出来,提取出来的病毒序列再与NT核酸库和病毒蛋白库进行二次比对,比对上的序列结果按照目、科、属、种进行分类统计生成表格,并列出比对结果的覆盖程度及相似度,未比对到病毒核酸库的序列再与蛋白库比对可发现未知病毒。 采用上述的分析技术,本文进行了以下分析:1、对一名不明原因腹泻患儿的粪便通过高通量测序筛查发现病原体腺病毒41型,为临床治疗提供了参考信息;同时针对测序筛查得到的腺病毒41型设计引物扩增目的病毒全基因组,进行二次测序获得病毒的全基因组序列,运用生物信息学软件和方法对病毒全基因组构建系统进化树,进行重组分析和突变分析,判断该病毒基因组与以往发现的病毒是否有较大差异,对其流行态势进行分析,以便为疫情防控和疾病治疗提供指导。2、针对陕西省2017年的肾综合征出血热的疫情,收集临床样本进行高通量测序确认汉坦病毒感染,设计病毒全基因组扩增引物,进行巢式PCR扩增,再次高通量测序得到病毒全基因组序列,运用生物信息学分析此次疫情的病毒株,并进行溯源分析,为疫情防控提供帮助。3、对2011年5-11月在云南勐腊县蚊虫进行病毒组学分析,结合基因组扩增测序,获得病毒全基因组序列,运用生物信息学对得到的病毒全基因组序列,进行同源性比对并构建系统发育树,发现云南蚊虫携带的多种新病毒,促进了对虫媒病毒多样性的理解。

关键词

动物病毒/高通量测序/病毒宏基因组/全基因组/生物信息学

引用本文复制引用

授予学位

硕士

学科专业

微生物学

导师

童贻刚

学位年度

2019

学位授予单位

安徽医科大学

语种

中文

中图分类号

S8
段落导航相关论文