摘要
面部表情是人类内心情绪的表达,是人与人之间交流沟通的重要媒介,其在智能驾驶、人机交互以及医疗辅助等领域均有广泛的应用。这也致使面部表情识别的相关研究具有很大的现实意义。传统的面部表情识别方法在特征提取阶段往往会受到客观因素的干扰,从而影响特征质量。深度学习的出现,则在很大程度上解决了这个问题。神经网络通过使用非线性映射方法,从而可以获得更高维度的特征表征形式。因此,基于深度学习的方法和传统方法相比,其特征提取以及泛化的能力相对更强。但是,传统的神经网络模型往往都具有很深的网络层数以及大规模的参数量和计算复杂度,导致模型的训练需要耗费大量的计算成本,而且,在深层次网络模型当中往往都会添加特征复用结构,如果不对输入特征进行处理,那么就会导致模型在训练过程中堆积冗余特征,从而影响特征质量以及模型的识别准确率,与此同时,表情特征的不确定性以及多样性,会使得模型在特征提取阶段出现特征缺失以及特征提取率低下等问题。故针对以上问题,本文主要从两方面着手来进行实验,主要内容如下: (1)传统深度学习方法往往具有参数量以及计算复杂度过大的问题,本文准备采用轻量化的神经网络模型来解决此问题,但大多轻量化模型当中都使用到了深度可分离卷积,使用此卷积确实可以降低参数量,但同时也会导致模型识别准确率的下降。因此,针对以上两点问题本文提出了一种基于改进卷积的轻量化面部表情识别模型。主要工作如下:采用轻量化网络ShuffleNetV2作为基线网络,从而保证方法的轻量化属性;参考蓝图可分离卷积以及空洞卷积的思想,设计并引入了改进后的卷积形式,提升了特征提取效能,同时使其可以胜任多尺度特征提取任务;设计并引入了浅层输入特征处理层,以简化网络结构,降低计算复杂度。最后本文也是将模型分别在Fer2013以及CK+两种不同数据集上进行了实验,从结果可以看出所提出模型的有效性。 (2)针对在特征提取阶段,由于面部表情的复杂多变,从而导致所提取特征的完备程度较低,以及在具有特征复用结构的深层次网络中存在大量冗余特征的问题。本文提出了一种基于筛选多尺度残差特征融合注意力机制的面部表情识别模型。主要工作如下:在改进后卷积模式的基础上设计并引入了多尺度并行特征提取通路,丰富了特征信息;设计并引入了特征筛选模块,以减少模型训练过程中产生的冗余特征,同时筛选出优质特征,提升特征质量;引入通道注意力机制,以突出局部关键特征信息;最后引入SMU激活函数,从而提升模型的非线性能力。对于所提出模型,本文分别将其在Fer2013数据集以及CK+数据集上进行了实验,通过实验结果可以看出,该模型可以在保证较低参数量以及计算成本的前提条件下在Fer2013数据集以及CK+数据集上取得比其他前沿方法更佳的识别准确率,相比而言具有更好的鲁棒性。