摘要
目的:Y染色体非重组区(non-recombiningregion,NRY)遗传标记具有父系遗传、单倍型遗传以及有效群体小等特点,已成为研究人类进化和群体遗传学的理想标记。Y染色体短串联重复序列(Y-shorttandemrepeat,Y-STR)和单核苷酸多态性(Y-singlenucleotidepolymorphism,Y-SNP)是NRY区两种最重要的遗传标记。其中,利用Y-SNP构建系统发育树进行单倍群划分是进行地理祖先和种群推断的主要手段之一。Y-SNP或其单倍群在不同地区和人群中的分布均表现出一定的特征性,可利用未知来源的男性样本的Y-SNP信息划分单倍群,以推断其地理来源或所属的群体;除此以外,还可以利用Y-SNP单倍群结合Y-STR数据进行家系溯源,从而辅助案件侦破,具有重要的法医学意义。本研究根据中国各个地区和群体的Y染色体遗传结构特点,拟筛选一组具有较高法医学应用价值的Y-SNP遗传标记,构建一个适用于中国人群的、高分辨率的完整Y染色体单倍群进化树,旨在为我国司法实践中对未知来源男性检材的地理、民族来源推断及家系溯源提供一种新的技术手段。 方法:通过文献调研和参照2017年ISOGG网站(Version:12.334)共选出183个Y-SNP位点,基于MassARRAY?系统和MALDI-TOFMS技术构建了一个Y-SNP检测体系。根据前期研究结果以及相关文献资料,参照最新版2019年ISOGG网站(Version:15.58)筛选出了381个Y-SNP位点,基于二代测序技术(NGS)构建一个适用于中国人群的、高分辨率的完整Y-SNP分型体系。依据DNA分析方法科学工作组(SWGDAM)提出的“DNA分析方法验证指南(2016)”从重复性、准确性和一致性、灵敏度、特异性、混合物、法医案例检材适用性和人群研究等方面对两个体系分别进行法医学性能评估。 结果:基于MassARRAY?系统和MALDI-TOFMS技术成功构建一个包含183个Y-SNP位点的复合检测体系(简称183-plexPanel),扩增片段大小在80~120bp左右。分为5个Pool,依次命名为Pool1、Pool2、Pool3、Pool4和Pool5。每个Pool里的Y-SNP位点个数分别有:36、42、40、35和32个。每个Pool的检出率分别为99.72%、99.05%、96.25%、98%和96.25%,平均检出率为97.89%。基于二代测序技术成功构建了一个包含381个Y-SNP分型体系(简称NGSPanel),扩增片段大小在160~280bp之间,20X以上的平均检出率为95.81%。两个体系单倍群结果具有一致性,准确性高达100%。183-plexPanel灵敏度较低,DNA投入量在10ng时能获得完整分型。NGSPanel灵敏度较高,在DNA投入量低至1.25ng时可获得完整的381个Y-SNP位点的分型。对于两个体系,即使在低浓度DNA投入量(78.125pg)时仍能获得正确的单倍群分支方向。利用NGSPanel在混合物检测方面,男-男混合比例在1∶1、1∶3和3∶1时,单倍群划分为两者共同主干单倍群;在混合比例为1∶9、1∶19、9∶1和19∶1时,单倍群划分为主要成分的男性单倍群结果。两个体系对于不同类型的案例检材适用性均较好;对于来自同一个人的不同组织的生物检材,其检测结果一致,具有组织同一性。在人群研究中,中国9个不同地区人群共1419名男性无关个体通过183-plexPanel检测结果显示,不同中国群体单倍群分布存在差异。例如,O单倍群在汉族人群中分布最多(70%~86%);C单倍群在新疆蒙古族人群中分布较多(67%);D单倍群高频分布在青海藏族(62%);R单倍群在新疆维吾尔族群体中分布较多(34%)。9个人群共获得134个末端单倍群,单倍群多样性值(HD)为0.95531,其中汉族HD值最高,分别为0.96572(山东汉族)和0.94596(江苏汉族)。利用NGSPanel在200例汉族人群中检测共获得93个末端单倍群,HD值高达0.9883,较183-plexPanel分辨率更高、系统效能更强。NGSPanel能将共享Y-STR单倍型的两个无关个体区分开来,可在单倍群水平上达到区分不同家系的目的。 结论:本文基于MassARRAY?系统和MALDI-TOFMS技术构建的183个Y-SNP复合扩增体系和基于二代测序技术构建的包含381个Y-SNP的复合扩增体系,从重复性、准确性和一致性、灵敏度、特异性和法医学检材适用性等方面进行了法医学性能评估,结果表明两个体系总体性能较好。183-plexY-SNPPanel在中国人群中具有一定的区分能力,不同中国群体单倍群分布表现出特异性,尤其在汉族群体分辨率较高。NGSPanel具有灵敏度高、分辨率高和系统效能强等优点,可在单倍群水平上达到区分不同家系的目的。利用本研究构建的高分辨率的Y-SNP单倍群结合Y-STR数据,在法医系谱溯源或者家系排查等应用中,具有很好的辅助作用;在DNA模板量充足、实验设备配备的情况下,结合成本较低、节省时间以及数据处理简单等优点,可以考虑选择使用183-plexY-SNPPanel进行司法应用,尤其可用于Y-SNP数据库建设中;若实验室条件允许的情况下,优先推荐使用NGSpanel,可获得更高分辨率的单倍群结果,单倍群划分更细致,推断更加准确。本研究获得的人群单倍群数据为我国法医遗传学群体结构和人类学提供基础依据。