摘要
由于肺癌是对人类健康危害最大的恶性肿瘤之一,具有高发病率和高死亡率的特点,并且治疗成本较高,治愈率较低,给患者及其家人带来了巨大的经济负担和心理压力,因此急需精细化、高效化的肺癌诊疗方式。近年来,深度神经网络在智慧医疗领域做出了重要的贡献,但这种以大数据为驱动的学习算法,需要大量的医疗数据支撑。由于医疗领域存在一定的特殊性,如隐私、来源、标注成本等因素,难以形成较大的数据集用于复杂神经网络的训练。而利用公共数据集训练的人工智能模型不能满足实际需求。因此本文致力于解决以上问题,主要的研究内容可总结如下: 1.根据原始肺癌CT图像数据集的特点,采用直方图均衡化方法对肺癌CT图像进行灰度化处理,将原始图像的直方图从一个相对集中的灰度范围内变成在整个灰度范围内均匀分布,增强图像中病灶以及重要器官的特征像素,提高图像的整体对比度,使得图像更加清晰。同时由于数据集较小,并且不同类型的肺癌图像数量不平衡,因此采用数据增强的方式来扩展和平衡训练数据,利用平移、旋转、变换等方法从已有数据中创造一批“新”数据,增加训练的数据量,提高模型的泛化能力及鲁棒性,避免分类结果偏向于数量较多的样本,提高卷积神经网络学习特征信息的效率。 2.结合 AdaBoost 集成方法,提出了一种基于卷积神经网络的肺癌亚型分类算法。首先基于收集到的肺癌CT图像数据进行训练得到DenseNet卷积神经网络,将CT图像分为鳞癌、腺癌和小细胞癌,然后利用 AdaBoost 算法聚合多个分类结果以提高分类性能。实验结果表明,该方法可以取得较高的识别精度,性能优于 DenseNet,ResNet, VGG16和AlexNet网络,为肺癌类型的病理诊断提供了一种有效的非侵入性检测工具。 3.针对肺癌CT医学影像数据量相对较少的问题,引入迁移学习方法,并根据肺癌图像病灶信息的特征改进卷积神经网络,提出了一种基于卷积神经网络的特征提取与病灶检测模型。利用迁移学习和卷积神经网络从CT图像中检测肺癌的位置信息,解决了因图像数据量不足在训练过程中容易导致过拟合的问题。首先基于 PASCAL VOC2007大规模数据集进行训练得到预训练模型,然后用肺癌CT图像数据对网络参数进行调整,从而得到一个能够从CT图像中精准检测肺癌位置信息的网络模型,协助医生诊疗,促进医患之间的交流,提高肺癌医学临床领域的诊断效率。