摘要
目的 本研究旨在通过基因表达综合数据库(gene expression omnibus,GEO)和癌症基因组图谱(the cancer genome atlas,TCGA)数据库分析非小细胞肺癌(non-small cell lung cancer,NSCLC)与奥希替尼耐药的相关基因表达数据,以揭示奥希替尼耐药的潜在机制,并寻找新的治疗靶点或组合疗法策略.方法 筛选GEO数据库中的NSCLC和奥希替尼耐药数据集,分别为GSE1987和GSE165029;通过R软件包对基因表达数据进行差异分析、功能富集分析和蛋白质-蛋白质相互作用网络构建;进一步分析关键基因在TCGA数据集中的表达情况及其与生存率的相关性.结果 从GSE1987数据集中筛选出840个差异表达基因,其中403个显著上调,437个显著下调;GSE165029数据集筛选出468个差异表达基因,267个显著上调,201个显著下调.交集分析得到18个重叠的关键基因.GO和KEGG分析显示,这些基因主要涉及平滑肌收缩的调节、泛素蛋白连接酶活性的正调控等功能.PPI网络分析揭示,PLK1和CDC20的相互作用最为显著.PLK1和CDC20在NSCLC组织中的高表达与较差的生存预后相关.结论 本研究鉴定了多个与奥希替尼耐药性相关的关键基因,并揭示了其可能的生物学功能.这些发现为进一步理解奥希替尼耐药机制提供了新的见解,并为未来的NSCLC治疗提供了潜在的靶点和策略.