摘要
乳腺癌(BreastCancer,BC)是发病率全球第一恶性肿瘤,且发病患者趋于年轻化。乳腺癌在早期进行诊断并予以治疗,可以极大地改善患者预后情况。因此,乳腺癌的早期诊断十分关键。病理诊断是乳腺癌诊断的权威标准,其中有丝分裂细胞的检测是病理诊断重要的指标。但是在乳腺癌病理切片中,有丝分裂细胞分布稀疏、特征复杂、背景区域干扰细胞多,以及病理切片制作过程中极易引入人为噪声干扰,这些因素给有丝分裂的自动检测带来极大的困难。本文针对乳腺癌病理切片中有丝分裂细胞的检测和识别问题展开研究,具体内容如下: (1)提出一种结合注意力机制与集成学习的有丝分裂分割与分类算法。由于有丝分裂细胞稀疏、背景复杂,给检测造成极大困难,本文采用两阶段方法逐步提高检测率。首先采用结合注意力机制的分割网络(SEAttUnet)分割候选区域,SEAttUnet以AttentionU-Net作为基础分割网络,并在每层卷积组合操作中引入SE(SqueezeandExcitation)模块,实现对空间位置特征和通道特征的双重注意力学习。将分割结果对应的候选区域裁剪成patch,作为分类阶段的输入数据。分类阶段采用集成学习的方法完成分类。三个分类器分别构成三条支路,每条支路独立测试并输出结果。各条支路输出于决策层进行融合并获得最终分类结果。将该结果对应标注到原始图像中,得到检测结果。最后在ICPR2012竞赛数据上验证了所提方法的有效性。 (2)提出一种基于特征存储块(FeatureStorageModule,FSM)的度量学习方法实现BC病理图像有丝分裂细胞识别。病理切片中存在一些难以区分的非有丝分裂细胞,其特征与有丝分裂细胞极其相似,这些特征在识别时极易产生错误,这种样本被称为困难样本。针对这个问题,本文通过构建特征存储块来加强对于困难样本学习。首先,通过ResNet-50提取训练集特征并将其存入FSM存储块。将从每个batch中提取的特征与FSM内的特征组成样本对并计算损失,这样可以产生更多的困难样本对用于训练。FSM内的特征随着训练的进行不断更新,在最后一轮训练时提取所有特征存入FSM作为检索库。提取测试数据特征,借助Milvus库在FSM中完成特征相似度检索,并输出相似度最高的特征所对应的标签。在公开数据集(ICPR2012,MICCAI-TUPAC2016)以及合作医院病理科的数据中验证所提方法性能,准确率分别达到96.85%和98.61%,证明了方法的有效性。