基于深度学习的人脸图像超分辨率特征重建的研究

张晋禄¹

扫码查看

作者信息

1. 黑龙江大学
折叠

摘要

超分辨率算法是一种可应用于图像、视频恢复的图像重建算法，其工作是基于低分辨率的输入图像输出高分辨率的图像。人脸图像超分辨率是超分辨率任务的一个分支，图像中有多种不同先验信息存在，如关键位置地标图，热力图和解析图等，然而现有方法对先验信息的运用方式仍有不足之处。因此，本文设计一种基于先验信息的人脸图像超分辨率卷积神经网络以提升重建效果;另一方面，除了生成图像的真实性，图像的观感的优劣度也是评价算法的重要因素。针对这一方面，本文提出扩散模型应用在人脸图像超分辨率的方案。本文的主要工作如下: 为减小输出图像的像素损失，提高重建结果的有参考客观评价指标，论文提出基于先验信息的人脸图像超分辨率卷积神经网络（GlobalAttentionGuidedMulti-scaleNetwork,GAGMN）。该网络包含三个子模块:上采样模块、先验预测模块、图像重建模块。（1）上采样模块，实现分辨率的提升，重建粗超分结果;（2）先验预测模块，基于上采样模块的输出的粗超分结果进行先验信息的预测，用于下一步的融合重建;（3）图像重建模块将前两个模块的输出结果融合，实现最终超分辨率结果的重建。为平衡重建结果的像素损失和观感体验，论文提出基于扩散模型的人脸图像超分辨率网络（DiffusionModuleBasedFaceImageSuper-resolutionNetwork,DMBN）。本文将扩散模型网络应用在人脸图像超分辨率任务中，并对模型中最关键的噪声预测网络部分进行设计。针对噪声预测网络的结构，本文设计了一个双流网络进行噪声预测，该网络由Transformer和U-Net两条分支组成。改进的噪声预测网络能根据去噪进程有效的预测噪声。基于预测的噪声结果，扩散模型网络可以通过逐步去噪得到最终的重建结果。本文在公开数据集对两种方法进行验证，同时与其他算法进行实验比较，定量和定性实验结果证明了本文所提出方法的有效性，且两种方法可以应对不同需求场景。

关键词

人脸图像/超分辨率/先验信息/扩散模型/深度学习

引用本文复制引用

授予学位

硕士

学科专业

控制科学与工程

导师

刘明亮

学位年度

2023

学位授予单位

黑龙江大学

语种

中文

中图分类号

段落导航