摘要
目的: 利用影像组学对胃癌病灶的增强CT进行分析,预测胃癌同时性肝转移的发生风险。 材料与方法: 本研究是一项单中心回顾性研究,收集了从2016年6月到2022年6月期间接受了胃癌术前增强CT检查的同时性和非同时性肝转移患者的动脉期、静脉期和延迟期CT增强图像。收集临床信息包括患者的年龄、性别、病理T分期、病理N分期、M分期以及肝转移情况。将收集的病例数据以7:3的比例划分为训练集和测试集。使用3DSlicer以胃癌轴位的最大层面作为感兴趣区域(RegionofInterest,ROI)对动脉期、静脉期及延迟期分别进行手动勾画。由一名医师勾画ROI,另一位医师审校,两位医师对患者的临床信息不知情。使用Python提取影像组学特征并进行标准化处理。用Mann-WhitneyU检验进行特征筛选,仅保留P值<0.05的特征,采用Spearman检验保留相关性比较高的特征中的一个,使用最小绝对收缩和选择算子(TheLeastAbsoluteShrinkageandSelectionOperator,LASSO)及交叉验证获得预测的关键特征。采用多种机器学习方法建立预测模型并用多种统计学方法评估机器学习模型效能。 结果: 本研究回顾性纳入76例患者,同时性肝转移组33例,非同时性肝转移组43例。两组患者在性别(P=0.031)、年龄(P=0.02)、病理N分期(P=0.006)、M分期(P<0.001)上有统计学差异,在病理T分期上没有统计学差异(P>0.05)。上述特征在训练集和测试集上的分布均没有统计学差异(P>0.05)。同时性肝转移组中,除M分期特征外,上述特征在术前、术中确诊和术后6个月内发生肝转移的分布没有统计学差异(P>0.05)。分别提取动脉期、静脉期和延迟期的影像组学特征,每个病例的每个时相提取出851个影像组学特征,同时融合动脉期和静脉期影像组学特征,共1702个影像组学特征。 对这4类特征进行特征筛选,动脉期、静脉期、延迟期及融合动脉期和静脉期分别得到3个、9个、3个和9个特征。每类特征均通过6种机器学习方法建立预测模型,并对模型进行评估。其中静脉期模型中的逻辑回归(LogisticRegression,LR)模型、融合动脉期和静脉期中的LR模型及支持向量机(SupportVectorMachine,SVM)模型表现较好。静脉期模型中LR模型的AUC为0.90(95%CI0.78-1.00),准确率0.87,敏感度0.78,特异度0.93,阳性预测值0.87,阴性预测值0.87,精确率0.87,召回率0.78,F1值0.82,PR曲线下面积(AreaUnderPrecisionRecallCurve,AUPRC)为0.85,Brierscore为0.14。融合动脉期和静脉期特征中LR模型的AUC为0.97(95%CI0.90-1.00),准确率0.91,敏感度0.89,特异度0.93,阳性预测值0.89,阴性预测值0.93,精确率0.89,召回率0.89,F1值0.89,AUPRC为0.96,Brierscore为0.14;在融合动脉期和静脉期特征中,训练集SVM模型准确率0.81优于LR模型准确率0.70,测试集中SVM模型仅次于LR模型,测试集中SVM的AUC为0.89(95%CI0.73-1.00),准确率0.83,敏感度0.67,特异度0.93,阳性预测值0.86,阴性预测值0.81,精确率0.86,召回率0.67,F1值0.75,AUPRC为0.88,Brierscore为0.20。决策曲线的结果表明,上述模型有一定的临床实用价值。 结论: 基于胃癌增强CT的影像组学可以预测胃癌同时性肝转移的风险。融合动脉期和静脉期的LR模型和静脉期的LR模型以及融合动脉期和静脉期的SVM模型在预测中表现较好,有较高的准确率,研究结果显示所建立的模型具有临床使用价值。