摘要
动脉粥样硬化(Atherosclerosis,AS)是一种心血管疾病,其病因是血管内胆固醇和脂肪等物质经过氧化后逐渐形成粥状物质,并不断累积钙化,从而导致血管狭窄或者阻塞。AS的临床表现包括心绞痛、心肌梗死、突发性心力衰竭、脑血管疾病等,对人类生命健康构成威胁,是全球主要的死因之一。因此,对AS的病理生理机制有深入的研究意义,寻找治疗靶点以及研发新的治疗手段都具备重要的价值。 目的: 本研究旨在利用生物信息学的技术手段对 AS 患者样本中的基因表达数据进行分析,寻找AS的发病过程和进展中起着关键作用的基因。为此,对已知数据进行了整合,并使用R编程语言分析了差异表达基因及其生物学功能和通路,在五个数据集中筛选出 89 个具有基因显著表达差异的基因。随后,利用蛋白-蛋白相互作用网络分析筛选出分数top10的差异表达基因,并对相关数据进行分析以验证研究结果,筛选出具有预后价值的基因,从而确定AS形成和发展过程中的潜在基因。 方法: 本研究利用生物医学和生物信息学方面的知识,在GEO数据库中检索到了已公开发布的AS的基因芯片数据集,包括GS E66360、GS E28829、GS E41571、GSE71226和GSE100927。利用 R语言中 limma包的数据预处理功能,对上述五个数据集进行归一化和背景校正,以消除可能由于实验操作或测量设备引起的非生物学变异,并设置特定的统计阈值,筛选在AS患者和健康对照组之间存在显著差异的基因。随后,采用GSEA进行富集分析,并参考Wikipathways和Reactome 数据库对通路进行了注释。接着,对上述基因数据集进行了 WGCNA分析。此外,还使用 DAVID 和 KEGG数据库进行功能富集分析。最后,利用STRING数据库对差异表达基因的编码蛋白质及其相互作用进行网络分析,并使用Cytoscape软件对分析结果进行更加详细的展示。通过绘制蛋白质互作网络图和利用 MCODE 模块确定网络中的重要区域,并可视化展示了这些重要区域。为了验证研究结论的正确性,还进行了 qPCR和流式细胞术验证 Hub 基因的表达以及免疫细胞的活性。 结果: 我们对原始数据进行了标准化处理,并用箱式分布图直观展示了数据的分布情况。对标准化后数据进行聚类分析后生成热图,并观察到基因表达聚类现象。我们使用热图对显著表达的基因进行了可视化,并得到以下结果:在GSE66360中,有339个基因上调,103个基因下调;在GS E28829中,有394个基因上调,156个基因下调;在GS E41571中,有92个基因上调,49个基因下调;在 GSE71226 中,有 401 个基因上调,560 个基因下调;在 GS E100927中,有354个基因上调,156个基因下调。这样的可视化结果有助于深入研究和理解这些基因的功能与调控机制,以及它们在不同数据集中的表达情况。功能富集分析显示,差异基因在细胞组分方面的变化主要富集在细胞因子产生的正向调节、单核细胞分化、淋巴细胞分化、防卫反应的正向调节、免疫受体活性、生长因子活性、免疫球蛋白绑定、中性粒细胞胞外陷阱形成、破骨细胞分化、造血细胞谱系、利什曼病等。本研究根据STRIN G数据库进行蛋白-蛋白相互作用网络分析,并筛选出 24 个关键基因。包括 BLNK、MS4A1、IL4R、TCF7、FOXC1、ULRA2、BMP4、FGF13、L11RA、FCGR2、PLA2G7、FTO、CEBPA、FPR1、MMP9、NCF4、AQP9、CDK8、ETS2、PTGS2、CHI3L1、C3和IL7等。这些基因可能是导致动脉粥样硬化的潜在关键基因。通过免疫浸润分析与基因共表达分析,最终得出MMP、FGF13、NCF4、C3、FPR1、PTGS2与AS的自然杀伤细胞、中性粒细胞和调节性T细胞免疫细胞的浸润相关。 结论: 1. 在 NCBI的 GEO 数据库中使用关键词"Atherosclerosis"检索了在 NCBI的GEO 数据库,并下载了五个高通量基因芯片数据集(GSE66360, GSE28829, GSE41571, GSE71226 和 GSE100927)。 2. 进行了 GSEA 富集分析和 WGCNA 分析,并使用 Wikipathways 和Reacto me 数据库进行通路分析,可知与 AS 与中性粒细胞粒子释放、促炎促纤维化、淋巴与非淋巴细胞免疫调节。 3. 采用 STRING 数据库进行蛋白质相互作用网络分析并筛选出关键基因,这些关键基因有:MMP、FGF13、NCF4、C3、FPR1和PTGS2。 4. 通过免疫浸润分析和基因共表达分析,最终证实了MMP、FGF13、NCF4、C3、FPR1、PTGS2等基因与动脉粥样硬化相关,其中,自然杀伤细胞、中性粒细胞和调节性 T 细胞的活性与数量较低,这可能是导致动脉粥样硬化免疫浸润下降的重要原因。 5. 通过qPCR表达验证对Hub 基因 mRNA表达进行验证,并使用流式细胞术验证了调节性 T 细胞、自然杀伤细胞和中性粒细胞的细胞活性和数量,证实了分析结果的准确性。