基于神经网络与注意力机制的图像修复算法

李宇¹

扫码查看

作者信息

1. 中国科学院大学
折叠

摘要

图像修复最早可以追溯到文艺复兴，当时用来对艺术画作的缺失区域做修补。该技术能广泛地应用在医疗、军事、影视及教育等多个领域，正吸引着越来越多的学者投入到研究之中。但是传统的修复模型无法主动找到待修复区域的位置，且不能修复完全动态的图像，也没有统一的模型能应对时间与空间上都具有随机性的破损问题。而近年来深度学习在图像处理方向的快速发展与出色的表现，给予了研究者们新的思路与启发。首先，本文介绍了深度学习领域的自动编码器、生成对抗网络、深度可分离卷积、注意力与渐进增长机制等，着重论述了其在图像修复领域的良好特性，研究各自的实现机理与内在关联。然后，本文提出了一个改进的图像修复模型，其在充分结合自动编码器和生成对抗网络优势的基础上，为加强对局部细节特征的提取能力，引入了条件信息与注意力机制。为能够稳定地提高生成图像的分辨率，采用了渐进增长的训练机制。为更好地控制图像各级特征的生成，改进了生成器部分的自动编码器隐向量的定义公式，并逐级加入新的随机噪声以保证生成图像细节的多样性。通过本文模型在不同配置下的纵向对比，以及本文模型与其他三种比较主流的图像修复模型CVAE、DCGAN、WGAN的横向对比，主要从视觉效果与数值评价指标两方面，验证了各改进方法对模型性能提高的有效性及本文提出的神经网络的图像修复性能优越性。最后，为降低网络的参数量与计算量，进而提高模型在硬件设备上的运行帧数，采取了如把传统卷积全部替换为深度可分离卷积残差结构、权重初始化、权重剪枝及半精度变换等技巧对模型进行了优化。实验结果表明，本文方法具备更好的修复性能与实用性。

关键词

图像修复/特征提取/注意力机制/神经网络

引用本文复制引用

授予学位

硕士

学科专业

仪器仪表工程

导师

罗传欣

学位年度

2020

学位授予单位

中国科学院大学

语种

中文

中图分类号

段落导航