首页|基于血液DNA甲基化的年龄推断模型验证与优化研究

基于血液DNA甲基化的年龄推断模型验证与优化研究

孙晓萌

基于血液DNA甲基化的年龄推断模型验证与优化研究

孙晓萌1
扫码查看

作者信息

  • 1. 山西医科大学
  • 折叠

摘要

目的: 本研究旨在对前期基于中国汉族平原男性人群建立的9个CpG位点年龄推断模型在不同海拔地域、民族和不同性别人群中年龄推断的适用性进行验证及优化,以提升年龄推断的准确性和应用范围;分析检测体系的灵敏度,为实际案件检验提供数据支撑;比较EpiTYPER技术平台和焦磷酸测序检测DNA甲基化差异,探讨跨平台年龄推断模型计算方法研究。 方法: 1.将模型建立时选取的517份汉族男性样本分15~24岁、25~34岁、35~44岁、45~54岁、55~64岁、65~75岁六个年龄段,评估各年龄段预测差异及性能。 2.采集367份不同海拔地域、民族、性别个体的血液样本,使用EpiTYPER技术平台检测9个CpG位点的甲基化值,利用年龄推断模型预测样本供者的年龄,综合评估年龄预测的准确性。 3.将平原区与高原低氧区作为变量,利用AIC方法重新拟合模型,对比前后两个模型之间的年龄预测差异。 4.将100%DNA甲基化标准品设置为1000ng、500ng、250ng、125ng、63ng转化梯度,研究体系灵敏度。 5.应用EpiTYPER技术平台和焦磷酸测序测定65份外周血样本的9个CpG位点的甲基化值,评估模型年龄预测差异;对比z-score转化前后基于两种平台的年龄预测差异。 结果: 1.所有测试样本均获得相对准确的年龄预测值(N=367,MAD=4.0岁,R2=0.83)。 2.65~75岁模型预测偏差与其他年龄组有显著性差异,预测偏差增高。 3.9个CpG位点甲基化程度在青海汉族、藏族、回族间无显著性差异,且模型预测偏差在各个民族间无显著性差异。 4.TRIM59、CCDC102B上的DNA甲基化值分布在男性与女性间有显著性差异,但年龄预测模型在男性和女性样本间预测偏差无显著差异(MAD男=3.39岁,R2=0.83,;MAD女=3.63岁,R2=0.88),将性别作为变量纳入模型,预测性能未发生明显变化(训练集MAD=3.39岁,R2=0.82;测试集MAD=3.25岁,R2=0.88)。 5.9个CpG位点年龄预测模型应用于高原低氧区男性样本和平原区男性样本,其中平原区男性样本(N=123)MAD=3.42岁,R2=0.83;高原低氧区男性样本(N=204)MAD=4.42岁,R2=0.86。年龄预测偏差(︱预测年龄-真实年龄︱)在高原与平原间有显著差异,高原地区预测偏差整体高于平原。chr10:22334463/65、PDE4C上的DNA甲基化位点在平原与高原样本间表现出显著差异。 6.加入平原与高原变量,新建立了8个CpG位点的年龄推断模型,MAD=2.90岁,R2=0.86(验证集MAD=3.31岁,R2=0.83)。新建立的模型提高了高原地区样本年龄预测准确性。 7.灵敏度分析中转化前最低DNA用量为250ng(转化后最低DNA用量约为8ng)可获得9个位点完整甲基化信息。 8.65份血液样本应用9个CpG位点年龄推断模型,基于EpiTYPER技术平台检测MAD=2.49岁,R2=0.95,z-score转换后MAD=2.44岁,R2=0.94;基于焦磷酸测序平台检测MAD=4.20岁,R2=0.93,z-score转换后MAD=2.79岁,R2=0.94。 结论: 本研究证明了9个CpG位点年龄推断模型预测精度在不同性别间及同一地区汉族、藏族、回族间无显著差异。同一模型应该考虑高原低氧区和平原区人群血液样本DNA甲基化差异。加入平原与高原变量,新建立8CpG年龄推断模型可提高高原地区人群年龄预测准确性。z-score转化方法能够有效的消除不同平台间DNA甲基化值之间的系统性批次效应。

关键词

年龄推断/DNA甲基化/高原地区/性别差异/z分数/法医鉴定

引用本文复制引用

授予学位

硕士

学科专业

法医学

导师

李彩霞/丰蕾

学位年度

2021

学位授予单位

山西医科大学

语种

中文

中图分类号

D9
段落导航相关论文