摘要
目的 在自动编码器对肺腺癌基因表达组学数据进行降维的基础上,构建Cox的神经网络扩展模型,从而对肺腺癌患者预后进行预测.方法 首先通过两种无监督学习方法:自动编码器和主成分分析分别对肺腺癌的基因表达数据进行降维,然后构建Cox-nnet模型,并与DeepSurv模型进行比较,从中选择预测性能较好的方法来识别肺腺癌的高低危患者.结果 在TCGA与GEO两个数据集中,基于自动编码器降维后的Cox-nnet模型均有较好的一致性指数与AUC值,且高低预后两组患者的生存率都具有统计学差异.结论 自动编码器比主成分分析更适用于基因表达数据的无监督降维,且经自动编码器降维后的Cox-nnet模型拥有较好的预测性能,可以明显地区分肺腺癌的高低危患者,为肺腺癌的预后研究提供科学依据.