摘要
【摘要】目的探讨基于增强磁共振成像(Magneticresonanceimaging,MRI)的影像组学技术及机器学习,联合临床相关风险因素,筛选定量生物标志物,进而构建肝细胞癌(HepatocellularCarcinoma,HCC)根治术后早期复发预测模型的可行性,以指导临床术前决策。方法回顾性分析2015年1月至2020年12月在温州医科大学附属第五医院行根治性切除术的109例肝细胞癌患者资料,其中男性96例,女性13例,年龄(58.3±10.7)岁。依据术后12个月内是否复发,分为早期复发组(n=31)和对照组(n=78)。按1:4随机分为验证集(早期复发组7例,对照组16例)和训练集(早期复发组24例,对照组62例)。由两位放射科医生使用Radcloud平台(http://radcloud.cn/)于动脉期、门静脉期和平衡期MRI图像上分别勾画肿瘤感兴趣体积(VolumeofInterest,VOI),Radcloud平台自动提取肿瘤VOI定量特征,包括:第1组(一阶统计特征)表达的是定量描述MRI图像内的体素强度分布的常用和基本指标;第2组(基于形状和大小的特征)包含反映病灶区域形状和大小的三维特征;第3组(纹理特征)包含了量化区域异质性差异的特征。利用方差阈值、选择结果最好的前K个特征(SelectKBest)和最小绝对收缩和选择算子(Leastabsoluteshrinkageandselectionoperator,LASSO)方法对提取的肿瘤特征进行降维、筛选。使用Radcloud平台,基于动脉期、门静脉期和平衡期图像筛选的最佳特征,联合临床相关因素,分别建立机器学习预测模型。使用受试者工作特征(ReceiverOperatingCharacteristic,ROC)曲线下面积(AreaUnderCurve,AUC)、准确率(Accuracy,ACC)、召回率(Recall,REC)、平衡F分数(F1-score,F1)评估模型的预测效能。结果早期复发组肿瘤形态不规则、肿瘤边界不清比例和肿瘤长径高于对照组,假包膜比例低于对照组,差异均有统计学意义(均P<0.05)。比较三期模型效能,发现基于MRI增强平衡期构建的影像组学评分的诊断效能最佳,最终选择平衡期图像,以方差阈值0.8将1409个特征降维至465个特征,再使用SelectKBest降维至38个特征,最后使用LASSO方法筛选出7个最佳影像组学特征。进一步联合临床相关风险因素,构建了5种机器学习预测模型,分别为支持向量机(SupportVectorMachine,SVM)、高斯朴素贝叶斯(GaussianNaiveBayes,GaussianNB)、逻辑回归(LogisticRegression,LR)、多项式朴素贝叶斯(MultinomialNaiveBayes,MultinomialNB)、K最近邻(K-NearestNeighbor,KNN)。5种预测模型在训练集上的AUC、准确率ACC、召回率REC、平衡F分数F1分别是SVM(0.80,0.87,0.73,0.79),GaussianNB(0.80,0.87,0.73,0.79),LR(0.80,0.86,0.69,0.77),MultinomialNB(0.77,0.88,0.74,0.81),KNN(0.90,0.98,0.74,0.84);在验证集上5种模型的AUC、ACC、REC、F1分别是SVM(0.71,0.75,0.56,0.64),GaussianNB(0.76,0.80,0.50,0.62),LR(0.70,0.75,0.56,0.64),MultinomialNB(0.82,0.86,0.75,0.80),KNN(0.76,0.92,0.75,0.83)。5种预测模型中,以KNN模型的预测效能最高,在训练集和验证集中预测肝细胞癌术后早期复发的准确率分别为98%、92%。结论基于术前增强MRI的影像组学及机器学习构建的预测肝细胞癌根治术后早期复发模型中,以KNN模型预测的准确率较高,对指导临床决策具有较高的价值。