基于深度学习的多姿态人脸识别的研究

张梦雪¹

扫码查看

作者信息

1. 东华大学
折叠

摘要

伴随互联网技术的更新换代、不断发展，人脸识别技术被应用于生活的各个角落，依托于人脸识别技术的产生带来了诸多的便利，相应的推动了研究学者对于依托新兴产业的识别技术的深入研究。如今，人脸识别技术已经由传统的模板匹配、几何特征等识别方法过渡为基于神经网络的人脸识别方法，在基于实验环境下的识别效果甚至已经达到精准识别的水平。但是，在基于非理想状况的现实生活中，人脸识别的效果受到很多因素的影响，包括光照、遮挡以及多姿态等。在这些干扰因素中，多姿态问题仍然是研究的难点和重点，现实场景下由于人脸角度的偏转会导致人脸特征信息的缺失，造成识别效果低下。因此如何在多姿态角度偏转的情况下提高识别率是研究的重点。本文针对非配合条件下的干扰人脸识别最重要的因素进行研究，主要研究基于深度学习下的多姿态人脸识别。首先介绍了人脸识别的主要流程、多姿态识别的主要方法以及常用的多姿态人脸数据集。由于特征等变换能够将非正面特征映射到正面特征，而基于深度学习的人脸识别能够用神经网络来提取丰富的人脸特征信息，本文基于这两个方面的优点，将特征等变换在深度空间进行非正面特征的矫正，在深层次的空间下引入对于识别非正面特征所带来的误差。本文基于深度学习利用开源框架pytorch、tensorflow等对识别模型进行构建，利用公开数据集VGGFace2进行训练网络，最后利用CFP、IJB-A、LFW公开数据集进行测试。通过测试数据集最终的识别结果证明本文的多姿态识别模型对于具有挑战性的数据集识别效果较好，在人脸识别上能够达到96.83%的准确率，较一般的多姿态识别模型效果好。考虑到如今神经网络的层数不断加深，越来越多的神经网络被提出用于训练更新参数，本文基于三个神经网络进行比对，采用了两个经典的残差神经网络ResNet18和ResNet50以及2019年Google提出的轻量级神经网络模型MobileNetV3对人脸数据集进行训练，从训练结果上来看ResNet50和MobileNetV3效果较好，但是由于MobileNetV3采用的深层可分离卷积的思想，网络的计算参数相比ResNet18少，训练和参数的迭代更新也会较快。对于最后的识别结果测试，MobilNetV3效果准确度92.9%较ResNet50的92.5%好并且网络中的参数减少了3倍多。对于多姿态中的姿态角估计，本文在采用了基于dlib模型的68个关键点检测得到人脸特征后，利用非线性最小二乘法的思想采用OpenCV的solvePnP函数得到对应的旋转向量，从而得到人脸数据集在三维空间中的偏转角度。由于多姿态的人脸主要受到偏航角的影响，本文使用EPnP算法来拟合姿态估计模型，最终实现通过非线性优化来得到偏航系数的方程表达式。实验结果表明，对于该模型方法的设计，极端姿态下的识别效果也有较为优秀的表现，在LFW数据集上的平均识别结果可以达到97%，在更为复杂的数据集IJB-A上甚至达到95%左右的效果。说明本文采用的在深度空间进行姿态角度的偏转从而实现提高识别效果具有一定的意义。

关键词

深度学习/人脸识别/MobileNetV3/特征等变换

引用本文复制引用

授予学位

硕士

学科专业

软件工程

导师

万燕

学位年度

2021

学位授予单位

东华大学

语种

中文

中图分类号

段落导航