摘要
阿尔兹海默病(Alzheimer's Disease,AD),是一种神经退行性疾病,会对患者部分脑区造成不可逆损伤,最终导致患者记忆及身体机能受损。随着全球老龄化程度加剧,AD患者数目将不容小视。此外,中国AD患者的疾病相关成本远高于癌症和心血管疾病,将会成为加剧社会负担的重要一环。截至目前为止,研究尚未得出AD明确的致病机理和有效的治疗方法,大部分研究得出的都是相关的假说,如淀粉样蛋白假说、炎症假说等。但已有研究证明,AD早期诊断具有重要的个人和社会效益,那么结合中国国情来说,筛选出能够用于诊断AD的血液生物标志物将会产生更大的作用。 虽然已经存在少数生物标志物,如Aβ-42与Aβ-40比值、脑脊液(CSF)中tau蛋白的浓度及APP基因等具备较好的分类能力,但是目前并没有真正通过临床验证的AD生物标志物。本文使用不同脑区数据及时间序列数据,分别根据数据特征,采取不同方法构建差异基因共表达网络继而从网络中筛选出候选的生物标志物,并将候选生物标志物整合后使用血液数据进行初步验证,得到论文发现的AD生物标志物。全文主要研究内容如下: (1)对于不同脑区数据,本文采取整合六个脑区差异基因构建差异基因共表达网络的方法,得到差异基因共表达网络,通过对网络进行聚类,得到不同网络模块,后使用机器学习方法从网络模块中筛选出分类能力最好的模块,模块中含有的44个基因视为不同脑区生物标志物。最后,对模块进行功能富集分析发现其主要参与能量代谢、转化和功能失调修饰等生物学过程。 (2)对于时间序列数据,本文采取基于基因共表达网络构建差异基因共表达网络的方法,筛选出差异基因共表达网络,由于网络内部已成模块,挑选网络中差异最显著100条边中的189个特异基因进行SVM(Support Vector Machine)时序多分类评价,得到时间序列生物标志物。经过功能富集分析,得到生物标志物主要参与细胞程序性死亡,转录和磷酸化等生物学过程。 (3)整合不同脑区与时间序列生物标志物作为候选AD生物标志物,进行血液数据初步验证。采用SVM留一法对标志物分类能力进行评价,得到相应ROC(Receiver Operating Characteristic Curve)曲线及AUC(Area Under Curve)值。其中,不同脑区生物标志物对应AUC值为0.760,整合生物标志物对应的AUC值为0.920。鉴于上述两类基因整合后共232基因构成的生物标志物分类能力较好,可作为论文筛选出的AD生物标志物。