摘要
尘肺病是一种由于长期吸入生产性粉尘而引起的以肺组织弥漫性纤维化为主的全身性疾病,它目前是我国职业病中发病率第一的疾病。尘肺病的诊断依据主要来自于医生对肺部医学影像的分析判断,而在现代的医疗中,计算机辅助的医学影像分析技术已经被广泛使用。近些年来由于深度学习的重大突破,基于深度学习方法的医学影像分析研究逐渐成为主流。然而尘肺病作为我国高发的职业病,关于它的研究却并不多,还存在着待研究的问题:一是基于人工特征算法的尘肺病影像识别精度较低,二是算法分类结果缺乏可解释性。本文结合尘肺病本身的病理特点,围绕这两个问题展开了关于尘肺病X光片识别的研究与应用。 首先,针对人工特征方法对于尘肺病患病期别分类精度较低的问题,提出了基于深度卷积神经网络的层级分类方法。该方法分为两阶段,首先判断样本是否患病,然后再细分识别为“患病”样本的期别。在该方法的设计中,考虑了两个要点:一是单层级的基分类器要尽可能准确,为了设计好的基分类器,本文对比分析了多种深度卷积神经网络的分类结果,并基于代价敏感方法对选出深度卷积神经网络进行调优;二是所有层级的基分类器联合起来最终分类结果要尽量准确,为了调优最终效果,本文通过对比实验设计了截断点方法。经过实验证明,层级分类方法相较于普通的深度学习端到端式多分类方法提升效果明显,宏查全率由0.7723提升到0.9162,它能够更好的区分尘肺病第3期样本。 再者,针对尘肺病诊断需要可靠解释的问题,本文基于深度学习可解释性技术找到可疑患病区域给出了分类依据,并利用可疑区域的细粒度病理特征提升了分类精度。本文研究了两种特征可视化方法来探究尘肺病高维抽象特征。首先是通过Gradient-weightedClassActivationMapping(Grad-CAM)技术,获取到网络特征抽取层的分类权重与高维抽象特征,通过它们找到了每个样本分类过程中可能是结节、弥纤、尘斑等的图像病理区域,并以热力图的形式将这些区域高亮的标记出来,这些高亮区域即分类依据,称为“判别性区域”。再者在判别性区域的发现基础上,通过SelectiveConvolutionalDescriptorAggregation(SCDA)技术,在只有期别的标签情况下,将疑似尘斑等图像病理区域的高维特征从高维卷积特征中筛选出来,这种特征称为“细粒度病理特征”。本文对细粒度病理特征进行了进一步探究:降维可视化分析出了尘肺病医学影像各期别的特征区别,发现尘肺病的3期是瓶颈;使用该特征作为多种学习器的训练数据进行对比,在端到端的方法中尘肺病宏查全率由0.7723提升到0.8857,层级分类方法中尘肺病宏查全率由0.9162提升到0.9292,经过实验验证了细粒度病理特征的有效性。 最后,依据硕士期间参与的尘肺病识项目,设计和实现了尘肺病识别系统。本系统提供尘肺病分类与可疑患病区域定位的服务,这两个服务的核心算法分别是层级分类方法与可解释性技术中的判别性区域发现方法。该系统能够辅助医疗从业人员更快的判断尘肺病,以及辅助他们二次检查模型的分类结果,从而减少漏诊误诊的情况发生。