摘要
背景 骨肉瘤(Osteosarcoma)被认为是最常见的原发骨肿瘤,其发生发展的机制尚未完全被揭示。应对骨肉瘤的治疗方式主要包括手术和化疗的联合应用,然而手术切除严重影响患者的肢体功能,化疗也伴随着不同程度的副作用。因此迫切需要确定骨肉瘤的分子机制,寻找新的生物标志物来开发替代疗法或提高现有治疗方法的有效性。近年来,基因芯片、高通量测序结合生物信息学综合分析的方法被广泛地应用于肿瘤相关研究中。本研究综合应用多种生物信息学方法分析筛选骨肉瘤标志性基因,有助于揭示骨肉瘤发生发展的分子病理机制,为临床治疗及预后评估提供有力支持。 目的 本研究旨在应用多种生物信息学方法分析鉴定与骨肉瘤预后及转移密切相关的显著差异表达标志性基因。 方法 第一部分:选择GEO数据库中数据集GSE99671作为研究对象,纳入样本包含骨肉瘤组织18例,正常骨组织18例。测序数据应用NetworkAnalyst3.0工具分析筛选骨肉瘤组织和正常骨组织的差异表达基因,应用DAVID数据库对差异表达的基因进行功能富集(GO)和信号通路(KEGG)分析。通过STRING数据库构建差异基因的蛋白-蛋白互作网络(PPInetwork)。Cytoscape软件用于PPI网络可视化,使用CytoHubba插件的Degree算法计算,获得前二十个得分最高的核心基因(Hubgenes)。选取TARGET数据库中骨肉瘤患者基因表达数据和临床信息,通过生存分析评估核心基因与预后的相关性。在人正常成骨细胞hFOB1.19细胞系和入骨肉瘤细胞HOS、U2OS细胞系中,应用RT-qPCR实验检测CXCL12、CXCL10、LYZ和SELL的表达情况。 第二部分:选择TARGET数据库中骨肉瘤样本作为研究对象,测序数据应用R语言工具分析筛选转移组与非转移组骨肉瘤样品中差异甲基化基因和差异表达基因,并且两者取交集得到的基因作为后续研究对象。对差异表达的基因进行功能富集(GO)和信号通路(KEGG)分析。通过多因素Cox风险回归分析建立风险评分模型并进行生存分析。最后构建预测转移性骨肉瘤患者预后的诺模图,并通过ROC分析检验。 结果 第一部分:GSE99671数据集共鉴定出676个差异表达基因,包括149个上调基因和527个下调基因(P<0.05)。GO分析显示差异基因主要参与免疫反应、炎症反应和细胞外基质等生物过程或功能。KEGG分析显示差异基因主要参与细胞外基质-受体相互作用信号通路、细胞因子-细胞因子受体相互作用信号通路等。PPI网络由575个节点,3229个连接构成,分析结果显示差异表达基因在蛋白水平上具有复杂的相互作用关系。基于CytoHubba插件的Degree算法筛选得到核心基因:MPO,PPBP和CXCL12等。生存分析结果显示CXCL12、CXCL10、LYZ和SELL的差异表达能够显著影响OS患者总体生存期(P<0.05)。RT-qPCR结果显示CXCL12,CXCL10和LYZ在HOS和U2OS细胞中相较于hFOB1.19细胞中表达显著下调,与生物信息学分析一致。 第二部分:在转移性和非转移性骨肉瘤组之间,鉴定出1,741个差异甲基化基因,147个显着差异表达的基因。对差异甲基化基因和差异表达基因取交集发现,有6个交叉基因:AIM2,RPL22L1,PDPN,PKIB,GZMA和MDM2。本研究还进行了多因素Cox分析,确定选择AIM2和PKIB构建骨肉瘤的风险评分模型,且骨肉瘤预后与风险评分显著相关。最后,根据骨肉瘤患者的临床数据(如性别,年龄和风险评分)构建转移性骨肉瘤患者的生存率诺模图,ROC分析证明基于AIM2/PKIB的风险评分具有很高的预测准确性。 结论 1.CXCL12,CXCL10和LYZ基因在骨肉瘤组织和正常骨组织中差异表达,是潜在的预后生物标志物和治疗靶标。 2.基于年龄,性别和AIM2/PKIB风险评分构建的诺模图,可以预测转移性骨肉瘤患者1年,2年和3年的总生存期。