摘要
乳腺癌作为女性群体中最常见的癌症疾病,因其高死亡率,严重威胁女性的生命健康。乳腺癌的早诊断早治疗能够有效提升患者预后,降低死亡率。影像学检查是乳腺癌常见的诊断方法之一。数字乳腺断层摄影(Digital Breast Tomosynthesis, DBT)能够通过多层影像切片的形式提供乳房内部的结构信息,更清晰地显示出病灶的大小、形状和边缘特征。研究表明, DBT 影像能够帮助医生更准确地进行乳腺癌诊断,具备良好的乳腺癌诊断价值。深度学习近年来被广泛应用于疾病的诊断预测研究。传统深度学习方法的卓越预测性能依赖于大量数据样本的训练,但因乳腺癌影像数据难以大量获取,其在乳腺癌诊断预测任务上的性能受限。 本研究以提升深度学习模型在小样本量 DBT 影像数据上的预测性能,为医生提供更准确的辅助诊断依据为目标。本研究借助小样本学习方法,设计 k-way,n-shot 任务,划分查询集与支持集(n为支持集中每类样本的数量),构造深度残差小样本学习模型对 DBT影像病灶进行诊断预测研究,并进行模型优化改进。具体研究内容如下: (1) 基于自监督小样本学习的 DBT影像病灶分类研究 本研究使用小样本学习中基于度量的分类方法,构造小样本学习模型。利用深度残差网络(Residual Network, ResNet)分别提取查询集与支持集的深度特征,并通过度量查询集特征和支持集特征之间的相似性的方式来对查询集样本进行分类。 研究首先探索了 6种不同 shot数和 3种不同特征提取网络对小样本模型在 DBT影像病灶分类任务上的影响。实验表明,shot 数越大,小样本模型从支持集获得的类别信息越多,其分类性能越好,但是存在边际效益递减。最终,结果显示 shot 为 80 且骨干网络为ResNet34 的小样本模型综合性能最好,宏平均(Macro average)AUC 和微平均(Micro average)AUC为0.914和0.937。将此模型作为后续优化的基准模型。接着,通过将训练集样本数量减半的方式,进一步探索小样本学习模型在更小数据集上的预测性能。结果表明,模型在更小样本数据集上性能依旧可观,宏平均AUC和微平均AUC达到了0.902和0.934。 其次,为提升小样本模型在有限样本中提取通用特征的能力,本文设计了 Simsiam自监督网络对小样本模型的初始权重进行优化。Simsiam 通过最小化同一图像的两个不同增强视图间的负余弦相似性,鼓励特征提取网络学习到更加鲁棒和具有信息量的表示。经过 Simsia m权重优化后,小样本模型的宏平均 AUC和微平均 AUC达到了 0.932和 0.949,相较于基准模型提高了2%和1.3%。良性类别AUC提升较大为2.8%。 (2) 基于双注意力引导的小样本学习及 DBT影像病灶分类研究 为了提升小样本模型对于任务相关重要特征的识别能力,本研究在基准模型的基础上,提出一种双注意力机制联合引导优化网络 DAMG。双注意力联合引导网络融合通道注意力机制和多尺度注意力机制。通道注意力机制通过对特征图的压缩和激励操作,调整每个通道的权重,帮助模型区分不同特征通道的重要性。多尺度注意力机制利用 ResNet 网络不同Stage的中间特征图,生成特征融合图,为模型补充图像的多尺度信息。将 DBT影像数据输入模型,最终,模型的分类性能得到提升,宏平均 AUC 和微平均 AUC 分别为 0.934 和0.949,较基准模型提升2.2%和1.3%。良性类别AUC提升较大为3.0%。最后,设计了注意力机制的消融实验,表明双注意力联合引导的有效性。 (3) 基于自监督和注意力引导融合的小样本学习及 DBT影像病灶分类研究 本研究将 Simsiam自监督网络和双注意力联合引导网络融合到基准模型中,分别在完整数据集和折半数据集上进行训练,进一步验证融合优化网络为小样本模型带来的性能提升,并进行内源模型对比。接着在完整数据集和折半数据集上引入三个纯 ResNet 模型进行外源模型性能对比。在完整数据集上,模型宏平均 AUC 和微平均 AUC 分别达到了 0.943 和0.956,相较于外源模型有着 2.7%和 2.7%的提升。在折半数据集上,模型宏平均 AUC和微平均 AUC分别达到了 0.911和 0.944,较外源模型提升 2.4%和 3.9%。最后对模型进行可解释性分析。 本文通过构建小样本学习模型分别在完整数据集和折半数据集上进行 DBT 影像病灶良恶性分类研究。接着,设计并构建自监督网络和双注意力引导网络对模型进行优化。通过实验验证,本文设计的深度残差小样本学习模型在小样本数据集上具有较好的性能,能够辅助医生提升乳腺癌诊断过程中的准确率和效率,具有重要意义。