摘要
目的 探讨基于不同瘤周范围提取的影像组学特征构建机器学习模型预测磨玻璃结节样肺腺癌浸润性的价值。 方法 回顾性分析2018年1月至2022年12月期间在锦州医科大学附属第一医院胸外科经过手术治疗,术后经病理证实为微浸润性腺癌(minimallyinvasiveadenocarcinoma,MIA)、浸润性腺癌(invasiveadenocarcinomacancer,IAC)的病例的323个磨玻璃结节。将所有患者按7∶3比例分为训练组和验证组。分别从瘤体和1mm、2mm、3mm、4mm、5mm瘤周范围提取六组影像组学特征,将瘤体与五组瘤周特征分别组合成五组组合特征,总共十一组特征,然后对训练组特征进行降维筛选后,构建逻辑回归模型、随机森林、支持向量机、自适应增强学习、K近邻算法、决策树、朴素贝叶斯、神经网络模型八种不同的机器学习模型,对比分析八种不同模型的性能和统计学差异,选择最优模型在验证组进行验证,根据训练组和验证组的受试者工作特征曲线(receiveroperatingcharacteristiccurve,ROC)对瘤体模型、1mm、2mm、3mm、4mm、5mm瘤周模型、瘤体与1mm、2mm、3mm、4mm、5mm瘤周组合模型共11组特征模型的性能进行评估,使用Delong检验法评价各组模型曲线下面积(areaundercurve,AUC)值之间有无统计学差异。 结果 基于瘤体和1mm、2mm、3mm、4mm、5mm瘤周范围提取的影像组学特征以及它们组合特征建立的八种不同的机器模型AUC值均大于0.75,均能有效鉴别MIA和IAC,但仅决策树模型AUC值与其他机器模型有统计学差异(P<0.05),其他机器模型间并无统计学差异(P>0.05);瘤体、3mm瘤周、瘤体与1mm瘤周组合、瘤体与4mm瘤周组合、瘤体与5mm瘤周组合的最佳机器学习模型均为神经网络模型,1mm瘤周、2mm瘤周、5mm瘤周的最佳机器学习模型均为朴素贝叶斯模型,4mm瘤周、瘤体与2mm瘤周组合、瘤体与3mm瘤周组合的最佳机器学习模型均为逻辑回归模型;瘤体、1~5mm瘤周及它们组合特征的模型在训练组AUC值大小顺序为:瘤体4mm瘤周组合模型>瘤体1mm瘤周组合模型>瘤体5mm瘤周组合模型>瘤体3mm瘤周组合模型>瘤体2mm瘤周组合模型>瘤体模型>1mm瘤周模型>2mm瘤周模型>4mm瘤周模型>5mm瘤周模型>3mm瘤周模型;各组特征的模型在验证组的AUC值大小顺序为:瘤体4mm瘤周组合模型>2mm瘤周模型>瘤体1mm瘤周组合模型>1mm瘤周模型>4mm瘤周模型>3mm瘤周模型>瘤体5mm瘤周组合模型>瘤体2mm瘤周组合模型>瘤体3mm瘤周组合模型>瘤体模型>5mm瘤周模型;各组模型无论在训练组还是在验证组,它们的AUC值之间均无统计学差异(P>0.05)。 结论 逻辑回归模型、随机森林、支持向量机、自适应增强学习、K近邻算法、决策树、朴素贝叶斯、神经网络模型八种不同的机器学习模型均具有较好的预测MIA和IAC的分类性能。1mm、2mm、3mm、4mm、5mm不同瘤周的CT影像组学特征构建的模型均具有良好的预测MIA和IAC的能力,但并没有发现最优的瘤周范围。瘤体、瘤周以及组合模型对鉴别诊断MIA和IAC有较好的预测价值,与瘤体、瘤周模型相比,组合模型并没有更明显的优势。