摘要
目的:同卵双生子(Monozygotic twins,MZT)鉴识一直是法医遗传学领域的疑难问题。因为MZT由同一个受精卵发育而来,拥有几乎完全相同的遗传信息,一般情况下,应用短串联重复序列(short tandem repeat, STR),单核苷酸多态性(Single nucleotide polymorphism,SNP)和插入缺失(Insertion and deletion,Indel)很难将二者区分。基因组中突变率较高的区域有可能记录MZT个体间的微小变异,如高度串联重复序列DYZ1,其序列结构复杂,且多拷贝分布;快速突变(rapidly mutating, RM)Y-STR突变率高于1×10-2;人类线粒体基因组(mitochondrial genome, mtGenome)突变率是核基因组突变率的10倍,且含量丰富。因此,本研究以DYZ1、RMY-STR和mtGenome为靶点,研究其在鉴别MZT中的潜在价值,并建立相应的技术方案,为解决法医学鉴识MZT的难题提供科学依据。 方法: 1.采用Q5超保真酶扩增3.5kbDYZ1阵列全长,构建文库后,通过SMRT测序3对MZTDYZ1阵列。参考Y染色体(NC_000024.10)和DYZ1阵列(X06228.1)比对测序结果,使用多重序列比对工具进行序列间分析。 2.采用IlluminaAmpliseq技术,构建19RMY-STRNGS分型体系,包括DYF387S1、DYF399S1、DYF403S1a、DYF403S1b1、DYF403S1b12、DYF404S1、DYS449、DYS518、DYS526I、DYS526II、DYS547、DYS570、DYS576、DYS612、DYS627、DYS464、DYS527、DYS630和DYS713。应用该体系测序38对男性MZT和2800MDNA。经Wintermute软件和STRaitRazor软件基因座分型后,比较该系统结果和毛细管电泳(capillary electrophoresis, CE)分型结果,比较MZT间分型差异。 3.采用REPLI-gMitochondrialDNAKit(Qiagen)扩增16对MZT全血mtGenome,在PacBioSequel平台上进行单分子(single molecular real-time,SMRT)测序。在2%异质性阈值水平,获得SMRT单倍型, 并与IonTorrentPGM测序mtGenome结果进行比较。分别以2%和5%作为阈值,筛选MZT个体间SMRT结果中的低水平变异差异,并进行位点分析。 结果: 1.SMRT测序DYZ1结果准确,覆盖度深,高度覆盖Y染色体7个区域。六个样本两次重复测序结果一致。与GeneBank中DYZ1序列比对分析,SMRT测序结果一致性程度明显高于Sanger测序结果。在7个测序深度大于20的区域内比较3对MZT的测序结果,或以X06228.1和56673248-3510bp作为参考基因组时,3对MZT间均未发现DYZ1阵列差异。 2.RMY-STRNGS体系实验参数良好,提示体系构建成功。对2800MDNA分析后设定分析阈值10%。在该阈值下,阴性对照9947ADNA在DYS526I出现非特异性扩增产物;阳性对照2800MDNA在DYS713、DYS547、DYS526II和DYS526I基因座表现reads数较低或有非特异性产物,其余13个基因座和CE结果分型一致且3次重复实验结果一致。比较38对MZT的NGS与CE结果,发现NGS结果多检出309个同等位基因和156个基于长度多态性的等位基因。从等位基因种类上分析,NGS结果比CE结果共增加106个等位基因。比较38对MZT间NGS分型结果,在5对MZT之间检出5个等位基因差异。 3.SMRT测序mtGenome结果准确,高覆盖,一致性佳,重复性好。在20个质量达到Q30的环化纠正一致性序列(circular consensus sequence, CCS)分子覆盖和2%异质性水平下,SMRT结果纠错少,比PGM结果覆盖更均衡,不受核线粒体假基因(nuclear mitochondrial pseudogenes, NUMTs)干扰,无SNP遗漏,共发现917个点异质性(point heteroplasmies, PHPs)。在2%异质性阈值且正向反向均有效匹配reads的条件下,所有16对MZT间均存在变异,共检出785个低水平变异差异,覆盖648个位点。将阈值提高到5%时,6对MZT表现出差异,占比37.5%。 结论: 本研究针对MZT鉴识难题,首次建立了SMRT测序DYZ1阵列技术,准确性高,重复性好,检测3对MZT的DYZ1阵列,未发现MZT间差异,提示DYZ1可能不是鉴别MZT的理想遗传标记;首次构建了19个RMY-STRNGS分型体系,其一致性、准确性和重复性均较好,在38对MZT样本中,5对MZT个体间检出差异,表明RMY-STRNGS分型体系具有一定的鉴别男性MZT的能力;建立了长片段SMRT测序mtGenome技术,准确性和重复性均较高。在2%阈值和20个质量高于Q30的CCSreads条件下,16对MZT间均表现出微小差异,区分MZT能力达到100%,表明SMRT测序mtGenome技术可有效区分MZT。综上,本研究为解决法医学鉴别MZT难题提供了新的遗传标记和技术方案。