基于深度学习模型与三通道分离重构的图像识别研究

张成¹

扫码查看

作者信息

1. 中北大学
折叠

摘要

作为机器视觉领域的一个重要分支，图像识别研究伴随着人工智能技术的出现得到了快速的发展。图像识别覆盖了人类生活的多个方面，其中军事、农业、生物医学和自动化等领域的发展较为突出。由于传统的图像识别方法依赖于人工进行预处理操作，该方法增加了特征丢失的风险。人类视觉的处理过程是将对图像内容的理解转化为对低层特征的语义理解，并将其逐层映射到高层领域，深度学习模拟了该过程。本文主要研究图像识别在混凝土配合比分类与乳腺癌诊断中的应用，通过深度学习模型来进行实验。论文的主要研究内容如下： 1.混凝土的不同配合比可决定材料的性能，对于多种配合比和粒径大小混凝土图像的分类研究，有利于工业废弃混凝土的高效回收利用。传统的混凝土配合比识别方法主要依赖于经典的手工特征提取方法，这些方法对于光照具有较强的鲁棒性，但由于只能提取低级特征，很难得到较高的识别精度。为了提升分类效果，本文提出了一种新的特征提取模块（ITFA-DLF），该模块在图像分离重构出的R，G和B三个通道上，使用卷积神经网络（CNN）提取三通道图像的颜色特征，使用多块局部二值模式（MB-LBP）提取三通道图像的纹理特征，将两种特征进行融合并输入到支持向量机（SVM）中进行分类。采用混凝土图像进行实验，对比多种分类方法得出所提模型的效果最佳，九类图像识别精度达到了92%以上，在保证分类精度的同时还缩短了分类时间，提高了混凝土图像的识别速度。 2.低层卷积神经网络与深度学习模型在特征提取能力上存在差异，这里使用深度学习模型来对乳腺癌图像进行识别。乳腺癌是妇女中常见的恶性肿瘤，造成了大量与癌症相关的死亡，计算机辅助诊断系统可以提高病理学家的诊断结果，从而降低人为判断失误对诊断结果的影响。由于乳腺癌图像中的颜色信息敏感性较高，我们在分离和重构R、G和B图像的基础上，使用深度学习模型"ColorDeep"来提取图像中不同组织部位所对应的颜色特征。首先将单通道图像从原始图像中进行分离，将其与两个使用零填充的通道进行连接重构出三通道纯彩色图像，重构出的纯色切片作为模型输入来提取三种独立的颜色特征，并在实验中单独对比三种颜色特征对识别精度的影响。模型的最后一个池化层中将三种颜色特征进行融合（ColorDeep+FF+Softmax）来提升识别精度，使用基于切片类别概率的多数投票原则（ColorDeep+Softmax+PD），将切片级概率提升为图像级识别结果。本文在BreaKHis公共数据集上对所提模型进行了5次实验，识别精度为99.67±0.18%。三种颜色特征对比实验结果表明，B通道所代表的核特征对识别精度影响最大，单张图像识别时间为0.24秒，提高了乳腺癌诊断的速度。本文在对两种图像数据的识别实验中，所提出的三通道分离重构与深度学习模型相结合的方法相比于其他方法的识别精度更高，所提取出的特征具有鲁棒性，相比于更深层次的深度学习模型拥有更快的识别速度，表明所提方法具有一定的价值，希望可以为图像识别方法扩宽思路。

关键词

图像识别/深度学习/特征融合/支持向量机

引用本文复制引用

授予学位

硕士

学科专业

数学

导师

白艳萍

学位年度

2022

学位授予单位

中北大学

语种

中文

中图分类号

段落导航