摘要
根据世界卫生组织最近几年的统计报告可以发现,对于癌症这种恶性肿瘤疾病,它的发病率与死亡率都在逐渐变高,已经对人类的健康造成了很大的影响。随着机器学习在医学领域的不断发展,机器学习的很多方法已经可以更准确地预测癌症的发生与转移,抓住疾病的最佳治疗时机,进而有效控制癌症的死亡率。针对这一现状,本文收集到2016年至2018年间长春市某大型医院的100名患者的397个放射组学特征,并依据统计学方法对收集到的放射组学特征来建立数学模型,进而预测非小细胞肺癌患者是否发生EGFR的突变。 对于EGFR突变,有很多影响因素,为了得到更有效的预测模型,本文首先对收集到的397个放射组学特征,应用LASSO算法进行特征选择,得到对EGFR的突变影响最大的15个放射组学特征,进而实现对放射组学特征的降维,消除冗余的特征。接下来对得到的放射组学特征建立基于机器学习算法的三种预测模型,分别为高斯过程、朴素贝叶斯模型、LightGBM算法,并进行简单地对比分析,可以发现LightGBM算法具有更明显的优势。依据这个预测模型可以有效地判断非小细胞肺癌患者是否发生EGFR的突变,并且可以为接下来的研究提供了新的思路,同时为奋斗在一线的临床医生提供更有价值的诊断信息。