首页|基于深度学习--机器学习融合的骨肿瘤分类模型构建与应用研究

基于深度学习--机器学习融合的骨肿瘤分类模型构建与应用研究

刘仁懿

基于深度学习--机器学习融合的骨肿瘤分类模型构建与应用研究

刘仁懿1
扫码查看

作者信息

  • 1. 南方医科大学
  • 折叠

摘要

骨肿瘤发病率较低,但原发恶性骨肿瘤在20岁以下癌症患者死亡原因中高居第3位。不同类型骨肿瘤(良性、恶性和中间型)临床治疗方案存在较大的差异,良性骨肿瘤生物学行为稳定,多采取病灶内局部刮除或随访观察的治疗方案,而恶性骨肿瘤侵袭性强,采用早期辅助化疗加广泛手术切除的治疗策略可提高患者的生存率。骨肿瘤病种繁多,单纯膝关节周围就包含了十余种不同类型的骨肿瘤,影像学表现复杂,诊断医生尤其是低年资医师由于缺乏足够的临床经验,较难做出精准的诊断,明显影响临床治疗效果和预后。临床诊断工作中,数字化X线摄影(DR)、电子计算机断层扫描(CT)和磁共振成像(MRI)是常规的影像学检查方法,其中数字化X线摄影由于具备空间分辨率高、检查快捷方便、价格低廉等特点,成为临床对骨关节病变患者首选的检查手段。 人工智能(artificialintelligence,AI)是一门包括计算机科学、控制论、信息论、数学等多种学科相互渗透,研究模拟人类智能并对其扩展延伸的一门综合性前沿学科。在医学影像领域,AI技术的应用提高了图像的解读和诊断速度,改善了准确性及质量,卷积神经网络(convolutionalneuralnetwork,CNN)作为其中的代表,可以将图像本身应用于学习过程中,不需要在学习过程之前进行特征提取,最重要的功能是可以自动学习。机器学习来源于更早期的人工智能,需要对事先提取好的特征进行学习以完成任务,在一些传统的大数据分析领域,依旧是主要的分析工具。AI目前在骨关节系统影像领域的研究主要集中于以下方面:①骨龄测量:基于深度学习技术对儿童骨龄评估的相关AI产品在国内外都有研发,从读片到输出诊断报告达到秒级完成,各产品模型评估骨龄的准确性近似甚至优于放射科医师;②骨折的识别及预测:国外研究团队对骨折的检测集中于在X线、CT检查中骨折判读及解剖定位,或者结合骨结构、骨密度等分析预测骨折风险,以及预测癌症骨转移患者骨折风险;③骨质疏松:多种AI方法可以帮助筛选骨质疏松或骨折的危险人群,并且与传统的决策工具相比,AI可以更准确识别绝经后妇女患骨质疏松的风险;④对关节软骨病变的识别:使用深度学习在磁共振上实现对软骨的自动分割、中软骨病变(包括软骨软化、纤维化、局部缺损、软骨退变引起的弥漫性变薄和急性软骨损伤)的检测。 但迄今为止,AI在骨肿瘤诊断方面的研究较少,原因可能是:①骨肿瘤相对少见,病例数量不足;②发病部位繁多,病种类型复杂,数据一致性差,模型构建困难。这些均成为AI辅助诊断工具在骨关节系统临床应用上的推广障碍。因此,构建一个准确可靠的骨肿瘤辅助诊断工具,具有十分重要的临床意义。 本课题以骨肿瘤为研究对象,拟通过构建X线骨肿瘤分类模型,为临床医生尤其低年资医师提供一个可靠的辅助诊断工具,提高诊断效率。本研究分为以下两个部分:①构建深度学习模型用于X线平片的骨肿瘤分类;②利用机器学习及深度学习技术,结合临床信息及X线平片,构建骨肿瘤分类模型,并进行阅片实验,将融合模型阅片结果与医生在有和无融合模型帮助下的阅片结果进行比较,探讨其临床应用价值。 一、材料与方法 1.病例资料 回顾性收集南方医院2012年至2019年经病理确诊的骨肿瘤患者的术前X线平片及临床资料,按纳入及排除标准筛选后,共643例(982张X线片)入组本研究。通过查阅患者临床资料,收集临床特征,以世界卫生组织(WorldHealthOrganization,WHO)第五版骨肿瘤分类标准将其分为良性、恶性及中间型。 2.数据预处理 两名放射科医师在X线平片上对骨肿瘤病灶进行框取裁剪,像素值进行归一化处理,统一预处理成3通道512×512像素,并且进行随机翻转等数据增强处理。对于临床特征,所有语义类数据用0/1表示,数值类数据进行归一化处理。 3.模型构建 将骨肿瘤患者按照8∶1∶1比例随机分为训练集、验证集及测试集,基于经预训练的InceptionV3的卷积神经网络模型分别构建良性与非良性、恶性与非恶性、中间型与非中间型二分类模型以及直接三分类模型。最后使用机器学习模型极端梯度提升树(eXtremeGradientBoosting,XGBoost)将临床特征与X线骨肿瘤分类深度学习模型融合进行骨肿瘤分类。通过SHapleyAdditiveexPlanation(SHAP)计算融合模型中的特征贡献度。 4.阅片试验 试验组由5名放射科医生组成:最小年资为2年,最大年资为12年。阅片数据同模型测试集,每位医生独立进行两次阅片,对骨肿瘤进行三分类测试,第一次为无三分类融合模型辅助诊断测试,第二次是在有三分类融合模型辅助的基础上进行三分类测试,以检验模型的辅助诊断效能。两次阅片时间相隔4周,且病例顺序打乱。 5.统计分析 针对二分类模型,计算其准确率,敏感性,特异性,ROC-AUC;针对三分类模型,计算总体准确率、宏平均(macro-average)的敏感性、特异性、ROC-AUC以及Cohen''sKappa系数;三分类下子类指标计算同二分类。 二分类的准确率、敏感性、特异性使用McNemar检验,AUC使用DeLong检验,所有宏平均指标使用Bootstrap法。用双侧检验,以P≤0.05为有统计学意义。 二、第一部分研究结果 1、所收集643例病例,平均年龄26.29±18.02岁。根据第五版WHO骨肿瘤分类,共有392例良性(平均年龄23.02±16.33),158例恶性(平均年龄33.59±20.58),93例中间型骨肿瘤(27.68±16.47)。 2、在二分类任务中,深度学习模型分类良性与非良性的AUC为0.846,恶性与非恶性的AUC为0.827,中间型与非中间型的AUC为0.820。 3、在直接三分类任务中,深度学习模型分类总体宏平均AUC为0.813,良性、恶性及中间型子类AUC分别为0.881、0.826和0.732。 三、第二部分研究结果 1、在深度学习模型的基础上,利用机器学习技术,结合X线平片病灶特征+临床信息构建融合预测模型。对骨肿瘤进行二分类任务中,分类良性与非良性及恶性与非恶性的AUC分别为0.898和0.894,较单独X线深度学习模型有显著提高(P均<0.05);中间型与非中间型的AUC为0.865,较单独X线深度学习模型有提高,但无统计学显著性(P≥0.05)。 2、在直接三分类任务中,融合模型分类总体宏平均AUC为0.872,良性、恶性及中间型子类AUC分别为0.898、0.855和0.864。除良性子类以外均有显著提高(P均<0.05)。 3、直接三分类融合模型中的特征贡献度排序中,前三均为平片模型的输出,即病灶平片上表现为良性、恶性及中间型的预测概率。而临床特征排列前五的特征为血沉、年龄、疼痛、肿瘤发生于长骨及发生于关节周围;单独子类分析中,良性子类中排第一的特征为平片模型预测病灶为良性的概率,临床特征中血沉、是否疼痛及是否发生于长骨为位列前三的重要特征;恶性子类中排第一的特征为平片模型预测病灶为恶性的概率,临床特征中血沉、年龄及是否发生于关节为位列前三的重要特征;中间型子类中排第一的特征为平片模型预测病灶为中间型的概率,临床特征中年龄、是否发生于关节及是否发生于长骨为前三的重要特征。 4、阅片实验中,5名放射科医生在无模型辅助下直接三分类宏平均AUC分别为0.838、0.910、0.774、0.810和0.762;在直接三分类融合预测模型的辅助下,宏平均AUC分别为0.848、0.938、0.766、0.856和0.853。4名医生(2名低年资医师及2名高年资医师)的宏平均AUC得到提高,其中2名低年资医师的提高具有统计学显著性(P<0.05);1名低年资医生的宏平均AUC稍下降但无统计学差异。 5、无论平片模型、融合模型还是医生独立诊断,对于中间型骨肿瘤的分类能力均低于其他两种类型骨肿瘤。融合模型的直接三分类能力与其中经验最丰富2名的放射科医生相当,高于其他三名。 四、结论 1、深度学习模型可在X线平片上对骨肿瘤病灶较好地进行良性、恶性及中间型骨肿瘤的分类。 2、利用深度学习-机器学习技术,结合X线平片病灶特征及临床信息所构建的融合预测模型对骨肿瘤的分类效能可得到明显提高。 3、在直接三分类融合模型的辅助下,能一定程度上提高放射科医师,尤其是低年资医师在X线平片上对骨肿瘤的诊断与鉴别诊断能力。

关键词

骨肿瘤/深度学习/机器学习/辅助诊断/X线摄影

引用本文复制引用

授予学位

硕士

学科专业

影像医学与核医学

导师

陈卫国

学位年度

2022

学位授予单位

南方医科大学

语种

中文

中图分类号

TP
段落导航相关论文