摘要
面部表情作为心理状态的直接体现,可提供丰富的情感信息,是了解个体情感状态的重要途径之一。面部表情识别作为模式识别领域的关键技术之一,近年来受到了极大的关注,尤其在人机界面、驾驶安全和医疗保健等多个领域有着广泛的应用。随着深度学习技术的快速发展,得益于卷积神经网络先进的特征学习能力,人脸表情识别领域得到了全面的扩展。尽管卷积神经网络在该领域取得了显著的成果,但在表情特征提取方面仍存在一些限制,这可能影响模型的人脸表情识别结果。此外,传统的卷积神经网络通常需要较大的模型尺寸才能保持高性能,在资源受限的设备下部署及运行较为困难。针对这类问题,本文深入研究了基于卷积神经网络的人脸表情识别方法,主要做了以下几个方面的工作: (1)针对卷积神经网络在提取表情特征信息方面的不足,从而导致识别率低的问题,本文提出了一种基于改进的金字塔卷积网络,即PCAF-Net。该网络以Pyconvresnet50为核心框架,设计了改进金字塔卷积模块(ImprovedPyramidConvolutionModule,IMPy),通过融合不同尺度的卷积核,以提高特征的多尺度表达能力,对面部表情进行全面提取;同时引入坐标注意力机制(CoordinateAttention,CA)提高表情关键特征的网络定位能力;最后采用ArcFace损失函数提高表情判别能力和训练稳定性。在Fer2013、CK+和RAF数据集上对所提出的网络进行性能测试,实验结果表明:坐标注意力和ArcFace损失函数相较于其他注意力和损失函数有更好的关键区域识别能力和分类能力;相对于基线网络,PCAF-Net网络在表情特征提取方面得到了增强,从而提高了网络的识别性能,其识别率分别达到了71.58%、92.02%和82.45%。 (2)针对人脸表情识别中由于卷积神经网络结构复杂而导致识别精度低的问题,本文提出了一种基于改进的FasterNet的人脸表情识别网络,即FGENet。首先将FasterNetblock模块中的部分卷积(PartialConvolution,PConv)替换为(ReceptiveFieldEnhancement,RFE)模块,以提升网络对面部表情关键特征的感知能力。其次,在残差分支中引入GSConv模块,有助于强化对不同区域的特征建模,提高了网络的表情特征提取能力。最后,将高效通道注意力(EfficientChannelAttention,ECA)引入Ghost模块中,设计出深度高效注意力模块,将其应用到全局池化后的标准卷积中,以更好地捕捉全局上下文信息。该改进网络的设计在保持较高准确度的同时显著降低了模型尺寸和计算需求。通过一系列实验验证,相比于基线网络,FGENet网络在Fer2013、CK+和RAF三个数据集上均取得了性能提升,分别实现了70.49%、97.89%和79.74%的识别准确率,证明了其在人脸表情识别任务中的有效性。