摘要
目的: 基于汇总数据的孟德尔随机化(SMR)法整合mQTL、eQTL和GWAS数据,识别哮喘相关DNA甲基化位点和基因。分析哮喘相关基因的生物学功能,探索DNA甲基化、基因表达和哮喘风险间的潜在调控机制,为探讨哮喘病因和药物靶点提供理论依据。 方法: 运用SMR法整合mQTL和GWAS数据,识别哮喘相关DNA甲基化位点,利用R4.2.2软件“ChAMP”包注释DNA甲基化位点的邻近基因和基因组区域信息。运用SMR法整合eQTL和GWAS数据,识别哮喘相关基因,对哮喘相关基因进行基因本体论(GO)富集分析、京都基因与基因组百科全书(KEGG)富集分析和蛋白-蛋白相互作用(PPI)网络分析,探究其生物学功能。运用SMR法整合mQTL数据和eQTL数据,识别与基因表达显著相关的DNA甲基化位点。整合多组学SMR分析结果,探究遗传变异通过DNA甲基化调节基因表达介导哮喘发生的潜在多组学途径。 结果: 1.mQTL与GWAS数据的SMR分析:基于McRaemQTL数据,识别237个哮喘相关DNA甲基化位点(PmSMRlt;5.37×10-7,PHEIDI≥0.01)。 2.哮喘相关DNA甲基化位点的注释:204个DNA甲基化位点位于Body(54.4%)、TSS1500(16.2%)、TSS200(10.3%)、5''UTR(9.8%)、1stExon(4.9%)和3''UTR(4.4%)六种基因组区域。 3.eQTL与GWAS数据的SMR分析:基于WestraeQTL数据,识别27个哮喘相关基因(PeSMRlt;8.42×10-6,PHEIDI≥0.01)。基于GTExeQTL数据,识别24个哮喘相关基因(PeSMRlt;7.32×10-6,PHEIDI≥0.01)。基于CAGEeQTL数据,识别37个哮喘相关基因(PeSMRlt;5.89×10-6,PHEIDI≥0.01)。 4.哮喘相关基因的整合:整合三次SMR分析结果,去除重复基因后共识别58个与哮喘相关基因。其中36个基因仅在一个eQTL数据集中被显著识别,14amp;nbsp;个基因在两个eQTL数据集中被重复识别,8个基因即RERE、NDFIP1、TEF、DDX5、CRAT、PPP2R4、MEI1和AHI1在三个eQTL数据集中被重复识别。 5.哮喘相关基因GO富集分析:生物过程的前十条显著结果为淋巴细胞增殖的调控、单核细胞增殖的调控、白细胞增殖的调控、α-βT细胞激活、淋巴细胞增殖、单核细胞增殖、细胞因子产生的正向调控、α-βT细胞增殖的调控、白细胞增殖和α-βT细胞增殖。分子功能的前十条显著通路为脂肽结合、Toll样受体结合、特定启动子染色质结合、NAD+核苷酸酶活性、NAD(P)+核苷酸酶活性、NAD+核苷酸酶及环状ADP-核糖生成、R-SMAD蛋白结合、作用于糖基键的水解酶活性、水解N-糖基化化合物的水解酶活性和核受体结合。细胞组分的前十条显著通路分别为特异性颗粒、特异性颗粒腔、RNA聚合酶II转录调控复合物、多聚核糖核酸酶P复合物、棕榈酰转移酶复合物、α-βT细胞受体复合物、微纤维、MKS复合物、SUMO连接酶复合物和轴膜。 6.哮喘相关基因KEGG富集分析:前十条显著的KEGG通路分别为Th17细胞分化、哮喘、结核病、炎症性肠病、Th1和Th2细胞分化、造血细胞系、病毒蛋白与细胞因子和细胞因子受体的相互作用、硫代谢、C型凝集素受体信号通路和HIF-1信号通路。 7.哮喘相关基因PPI网络分析:PPI网络包含52个节点和153个边,平均节点度为5.88,PPI显著性富集P值为1.71×10-12,根据介数中心性排序的前五位核心基因为ORMDL3、ENO1、TLR1、MED24和GSDMB。 8.mQTL与eQTL数据的SMR分析:基于WestraeQTL数据,识别11,890个与基因表达相关的DNA甲基化位点(PmeSMRlt;2.90×10-7,PHEIDI≥0.01)。基于GTExeQTL数据,识别13,978个与基因表达相关的DNA甲基化位点(PmeSMRlt;2.15×10-7,PHEIDI≥0.01)。基于CAGEeQTL数据,识别17,411个与基因表达相关的DNA甲基化位点(PmeSMRlt;1.71×10-7,PHEIDI≥0.01)。 9.哮喘相关多组学SMR分析:识别三条显著的遗传变异通过DNA甲基化调节基因表达介导哮喘发生的途径。rs301806变异能通过上调cg01447281位点DNA甲基化水平降低RERE基因表达水平,RERE基因表达水平降低与哮喘低风险相关。rs879606变异能通过下调cg00112517位点DNA甲基化水平增加PPP1R1B基因表达水平,PPP1R1B基因表达水平增加与哮喘高风险相关。rs2949669变异能通过下调cg24929556位点DNA甲基化水平增加CD247基因表达水平,CD247基因表达水平增加与哮喘低风险相关。 结论: 1.基于汇总数据的孟德尔随机化法识别237个哮喘相关DNA甲基化位点和58个哮喘相关基因。 2.哮喘相关DNA甲基化位点分别位于其邻近基因的Body、TSS1500、TSS200、5''UTR、1stExon和3''UTR区域。 3.GO分析发现哮喘相关基因的生物过程最显著富集于淋巴细胞增殖的调控,分子功能最显著富集于脂肽结合,细胞组分最显著富集于特异性颗粒。KEGG分析发现哮喘相关基因最显著富集于Th17细胞分化通路。PPI网络分析发现哮喘相关基因蛋白质相互作用中的前五位核心基因为ORMDL3、ENO1、TLR1、MED24和GSDMB。 4.整合多组学数据,识别三条显著的遗传变异通过DNA甲基化调节基因表达介导哮喘发生的潜在途径,分别为rs301806-cg01447281-RERE调节机制、rs879606-cg00112517-PPP1R1B调节机制和rs2949669-cg24929556-CD247调节机制。