首页|MtDNA全基因组二代测序体系的法医学验证及与核内分子标记联合应用进行复杂亲缘关系鉴识研究

MtDNA全基因组二代测序体系的法医学验证及与核内分子标记联合应用进行复杂亲缘关系鉴识研究

陈曼

MtDNA全基因组二代测序体系的法医学验证及与核内分子标记联合应用进行复杂亲缘关系鉴识研究

陈曼1
扫码查看

作者信息

  • 1. 南方医科大学
  • 折叠

摘要

背景与目的:线粒体DNA(mitochondrial DNA,mtDNA)由于其分子拷贝数多、环状结构耐降解、母系遗传、突变率高等优势,在法医亲缘关系鉴定、母系家系追踪、群体变迁和进化演变等方面有重要的科学和应用价值。对于mtDNA信息的分析主要包括mtDNA单核苷酸多态性(mtDNA single nucleotide polymorphism,mtDNA-SNP)、高变区(hypervariable region,HVR)、控制区和全基因组四个维度,其中全基因组的序列分析无疑是最充分应用mtDNA母系遗传信息的方法。MtDNA全基因组信息主要是通过二代测序获得,研究人员通过短片段(<200bp)、中等片段(300-500bp),长片段扩增(>4kb)的建库策略,实现mtDNA全基因组16569bp序列的全覆盖。但是由于核基因组DNA中mtDNA同源序列的存在,短片段和中等片段的策略发生核DNA错配概率更高,表现为目标mtDNA上位点的缺失或结果的假阳性。复杂亲缘关系鉴定在失踪人口调查、灾难事故受害者确认、打拐、寻亲等案(事)件侦查实践中发挥重要的作用。当前对于复杂亲缘关系鉴定的主要方式是通过增加遗传标记个数、多种类型遗传标记组合分析、系谱分析等。但是新遗传标记从被发现到能被应用相距甚远,系谱分析则需要较大的可用于搜索的先验数据库。而mtDNA、X染色体短串联重复序列(X chromosomal short tandem repeat,X-STR)和 Y 染色体 STR(Y chromosomal STR,Y-STR),主要作为排除或支持鉴定结论的定性工具,缺乏科学合理的量化判定分析算法。相较而言,联合应用目前已成熟的且具有标准文件支撑的多种遗传标记是较为实际和可行的复杂亲缘关系鉴定方法。本课题采取现有常用核 DNA 遗传标记(autosomal STR,A-STR、X-STR、Y-STR 和 SNP)同核外遗传物质mtDNA联合分析的策略,充分发挥核内、核外、母源、父源遗传物质的特征和优势,进而实现提升复杂亲缘关系鉴定效能的目标。 方法与内容:(1)对搭载于国产华大基因测序平台,应用长片段扩增策略开发的法医mtDNA全基因组测序体系的测序性能和法医学应用效能进行评估。其中测序性能包括原始下机数据质控、数据比对拼接、mtDNA变异位点读取全流程。在法医学应用效能方面,评估检测体系的灵敏度,对混合样本、不同组织体液来源样本、降解样本(自然降解和物理降解)和家系样本的分析效能。分析汉族群体母系遗传背景,探索汉族群体同其他群体的遗传关系。(2)基于国产华大基因DNA纳米球(DNAnanoball,DNB)测序平台获得多种类型遗传标记的序列信息,分析各种遗传标记在华大纳米球测序平台的数据质量。并从长度多态性和序列多态性两个维度,深入细致解析54个A-STR、27个X-STR、48个Y-STR、214 SNP和三个mtDNA高变区遗传标记的多态性,计算各类遗传标记的法医学参数,并评估其个体识别和亲权鉴定效能。(3)基于获得的STR、SNP和mtDNA汉族群体序列多态性和长度多态性信息,模拟一级、二级、三级32种不同亲缘关系家系样本对的分型数据,应用判别分析、似然比(likelihood ratio,LR)法和随机森林算法模型,探索遗传标记数目增加和不同遗传标记组合对一级、二级、三级亲缘关系,及同级不同亲缘关系的鉴定效能。 结果与结论:(1)在标准品DNA和血卡样本中,法医mtDNA全基因组检测体系获得的序列数据平均碱基质量值Q20、Q30分别为97.35%和92.41%。参考mtDNA序列和核DNA序列平均比对率分别为99.47%和0.53%。MtDNA全基因组16569个位点、37个功能区域100%覆盖,无缺失。A、T、C、G四个碱基平均识别准确率均大于99.78%,可识别小组分占比10%以上的异质性分型,且异质性比例结果有较大参考价值。对全基因组DNA投入为32.25pg样本、混合样本、降解样本(保存11年的FTA血卡样本)、不同组织体液样本、家系样本均可获得可靠、准确的结果。总之,法医mtDNA全基因组检测体系是一个数据质量高、灵敏度高、结果准确、适用于降解检材、可用于母系家系追踪,有较高法医学性能的mtDNA全基因组检测体系。(2)在129个STR基因座共发现984个长度多态性等位基因,1540个序列多态性等位基因,其中A-STR是序列多态性最高的一类标记,X-STR其次,Y-STR最低。对于54个A-STR而言,序列多态性前9个基因座的累计排除概率(combined exclusion power,CPE)即可达0.0000000001,同长度多态性前16个基因座性能相当。以上可知,序列信息的获得对于个体识别和亲权鉴定效能均有较显著的提升,基于序列多态性的多种类型遗传标记的联合分析,具有更强的复杂亲缘关系鉴定潜能。(3)家系数据结果证实序列多态性的获得可提升遗传标记的亲缘关系鉴定效能,长度多态性和序列多态性的245个常染色体遗传标记(autosomal marker,A-marker)对于一级、二级、三级亲缘关系鉴定的真阳性率分别是99.5%、82.5%和68.8%,99.6%、86.4%和68.5%。当遗传标记个数从20个增加到245个时,对于一级、二级、三级亲缘关系鉴定鉴定效能从85.50%提升到99.48%,83.03%提升到88.33%,45.82%提升到77.73%。多种类型遗传标记组合可显著提升不同级别亲缘关系和同级不同亲缘关系的鉴定效能,其中245个A-marker对一级、二级和三级的鉴定准确率分别为100%(LR阈值:10000)、86.33%(LR阈值:10000)和 39.75%(LR 阈值:100),组合分析 mtDNA、X-STR、Y-STR,可区分一级(91.45%)、二级(85.97%)和三级(60.40%)内不同亲缘关系。

关键词

法医鉴定/复杂亲缘关系/MtDNA全基因组/二代测序/分子标记

引用本文复制引用

授予学位

博士

学科专业

法医学

导师

朱波峰

学位年度

2023

学位授予单位

南方医科大学

语种

中文

中图分类号

D9
段落导航相关论文