摘要
背景:随着医疗技术的高速发展,甲状腺结节(Thyroidnodules,TNs)的检出率逐年增加,同时其过度诊疗的医疗现状也逐年严峻,TNs良恶性的早期准确诊断具有非比寻常的临床意义。 目的:本研究主要致力于通过二维超声(ultrasound,US)图像来构建影像组学评分(Radiomicscore,Rad-score),探讨Rad-score及TNs超声恶性危险分层中国指南(Chineseguildelinesforthyroidnodulesmalignantriskstratificationbyultrosound,C-TIRADS)联合诊断恶性TNs的价值。 方法:(1)本研究纳入2020年1月—2022年1月间湖北医药学院附属人民医院诊治甲状腺结节患者689例(847个结节)为训练组,同时纳入相同时期诊治甲状腺结节患者300例(403个结节)为验证组。 (2)训练组的二维US图像使用LabelMe软件进行分割,以确定感兴趣区(Theregionofinterest,ROI)。在这些ROI中,提取了超声图像的相关特征。采用最小绝对收缩和选择算法(LeastAbsoluteShrinkageandSelectionOperator,LASSO)选择能够预测结节良恶性的最具有区分性的特征。随后,使用10倍交叉验证构建了基于超声图像的影像组学模型,并计算了Rad-score值。利用验证组进行验证,并使用受试者工作特征曲线(receiveroperatorchaoacteristic,ROC)评估诊断性能。通过比较ROC曲线下面积(areaunderthereceiveroperatorcharacteristiccurve,AUC),来比较诊断准确性。 (3)采用多因素logistics回归分析Rad-score及C-TIRADS指南中的超声声像特征对训练组TNs性质的影响,并依据多因素logistics回归分析结果构建Rad-score联合C-TIRADS预测TNs性质的列线图模型,并于验证组中验证,列线图模型对恶性TNs的预测价值应用ROC曲线体现,采用校准曲线评估校准表现。 (4)以组织或细胞病理结果为金标准,计算并比较C-TIRADS模型、Rad-score模型及列线图模型诊断恶性TNs的AUC、准确率、特异度、灵敏度。 (5)统计C-TIRADS模型、Rad-score模型以及列线图模型所推荐进行细针穿刺(fine-needleaspiration,FNA)的结节数量,并计算其中病理证实为良性的结节占总体的比例,即不必要FNA率。然后,比较三种模型的不必要FNA率。 结果:(1)训练组847个结节,包括447个良性结节,400个恶性结节。验证组403个结节,其中126个良性结节,277个恶性结节。通过比较发现,两组患者的临床信息、超声图像特征及病理无组间显著性差异(P均>0.05)。两组患者的年龄、结节大小、超声特征差异有统计学意义(P均<0.001)。 (2)通过C-TIRADS分类,训练组结节中2类78个、3类92个、4A类54个、4B类81个、4C类163个、5类379个。验证组结节中2类34个、3类42个、4A类27个、4B类33个、4C类104个、5类163个。C-TIRADS模型诊断训练组AUC、诊断准确率、敏感度、特异度分别为0.813、81.1%、85.3%、77.4%;验证组准确率为86.6%,灵敏度为88.4%,特异度为82.5%,AUC为0.855。 (3)采用LASSO回归和10倍交叉验证获取10个优势特征,构建了Rad-score模型,该模型具有出色的诊断效能。在训练组中,AUC为0.906,诊断准确率为86.5%,敏感度为88.6%,特异度为84.7%;在验证组中,AUC为0.918,诊断准确率为92.1%,敏感度为92.8%,特异度为90.5%。 (4)Rad-score(OR=3.247,95%CI:3.821-107.623,P=0.001)、内部成分(OR=2.427,95%CI:1.906-8.271,P=0.017)、内部回声(OR=1.946,95%CI:1.421-11.383,P=0.037)、纵横比(OR=8.161,95%CI:2.941-31.156,P=0.004)、边缘(OR=9.580,95%CI:5.845-37.390,P=0.001)、钙化(OR=2.128,95%CI:1.817-8.962,P=0.024)是TNs的恶性影响因素;以上述影响因素构建的列线图模型具有良好的校准表现。训练组和验证组中,列线图模型诊断TNs的AUC、诊断准确率、敏感度、特异度分别为0.923和0.947、91.6%和95.0%、92.4%和95.7%、90.7%和93.7%。 (5)三种模型对比,列线图模型具有最佳的辨别能力,其AUC、准确率、灵敏度、特异度均高于Rad-score模型及C-TIRADS模型。 (6)与C-TIRADS模型及Rad-score模型相比,联合两者的列线图模型不必要FNA率最低。在训练组中,C-TIRADS模型的不必要FNA率为28.3%、Rad-score模型的不必要FNA率为11.8%、列线图模型的不必要FNA率为4.4%,验证组中C-TIRADS模型的不必要FNA率为22.6%、Rad-score模型的不必要FNA率为10.2%、列线图模型的不必要FNA率为3.5%,且差异具有统计学意义(P<0.001)。 结论:C-TIRADS模型、Rad-score模型及联合列线图模型对TNs的诊断均有较好效能,其中联合列线图模型更直观、诊断效能最优,对恶性TNs预测具有高准确性,且能够降低不必要FNA率。