摘要
目的: 帕金森病 (Parkinson’s disease, PD) 是一种复杂的神经退行性疾病,受遗传和环境因素的共同影响。虽然迄今为止各种遗传研究已经确定了许多致病基因和风险位点,但大多数预期的遗传性仍然无法解释。PD 的病因也仍不完全清楚。因此,寻找合适的、高精度的帕金森病风险预测模型对于帕金森病的早期预防、管理与治疗至关重要。人口统计学、临床评估、生物标志物和遗传学可以提供重要的信息,但将它们整合到PD 预测中仍然具有挑战性。多基因风险评分 (Polygenic risk scores, PRS) 用于评估疾病的遗传易感性,可以实现疾病的早期诊断并促进精确治疗的发展,提供额外的信息,但其稳健性和准确性取决于 PRS 的模型假设。因此,本研究使用了四种常用的不同建模假设的方法构建PRS,探索PD的潜在遗传结构,评估PRS的预测性能。并将传统的预测指标,包括人口统计学特征、临床评估量表和脑脊液生物标志物纳入,建立PD的风险预测模型,评估遗传因素对PD风险的贡献,同时,探讨PRS与PD以及PD危险因素之间的关系,进一步评估PD的遗传易感性,为PD病因学提供见解。 方法: 在本研究中,我们首先利用最大可用的GWAS汇总统计量整合遗传易感性,构建 PD 的 PRS。其次,我们从帕金森进展标志计划 (Parkinson’s Progression Markers Initiative, PPMI) 队列中下载了诊断为 PD 的 427 名病例和 169 名对照的全基因组测序数据和基线数据,对其进行质量控制,并随机分配到训练集和测试集,以避免过拟合。在不同的建模假设下,采用聚类与阈值法 (clumping and thresholding, C+T)、summary statistic Bayesian multiple regression model (SBayesR)、summary statistic best linear unbiased prediction (SBLUP) 和 summary statistic Dirichlet process regression (SDPR) 四种 PRS 预测方法对 PD 进行预测。然后,我们系统地将模型的预测准确性与PRS、人口统计学、临床评估和生物标志物逐渐整合进行比较。最后,我们调查了PRS与PD风险之间的关系,以及PRS与PD危险因素之间是否存在相互作用。 结果: 我们的研究表明,SDPR在预测帕金森病方面取得了更稳健的表现,可以更好地适应全基因疾病模型。它的平均曲线下面积 (AUC) 为 0.75,远高于现有的 PRS 模型。我们推荐的无创PD风险模型,通过结合PRS、人口统计学特征和临床评估(场景Ⅱ),AUC为0.91,显著高于不使用PRS的模型(P值<0.05),并与进一步纳入生物标志物的模型基本相同(P值>0.05)。此外,已知的PD危险因素显著增强了PD的预测能力,对模型做出了重大贡献。PRS能有效识别PD风险显著增加的个体,并且我们发现 PRS 与嗅觉功能以及运动障碍学会统一帕金森病评定量表的运动部分 (the motor section of the Movement Disorder Society Unified Parkinson’s Disease Rating Scale, MDS-UPDRS Ⅲ) 相关,其对 PD 风险的影响取决于性别和 MDS-UPDRS Ⅲ。此外,我们发现了 PRS 与性别、MDS-UPDRS 运动评分之间相互作用的新证据,为我们对PD的理解提供了进一步的见解。 结论: 我们的研究揭示了帕金森病的病因,这表明帕金森病具有全基因结构,其中少数单核苷酸多态性 (single nucleotide polymorphisms, SNPs) 发挥了很大的作用,而其他SNPs则具有轻微到中度的作用,因此使用SDPR对PD构建PRS,可以灵活地适应其遗传结构。我们也为PD的风险评估提供了一个实用的框架,利用PRS、人口统计学变量和非侵入性的临床评估量表,可以实现对帕金森病的准确预测,加强个性化风险评估,促进帕金森病的早期干预。此外,对于PRS与PD风险以及PD危险因素的之间关系的发现,对我们理解帕金森病的生物学机制具有重要意义。