摘要
人脸表情是反映人类内心想法最直接的方式。表情识别是模式识别和计算机视觉等相关领域的重要研究主题之一,已被广泛应用于心理学、刑侦、陪伴机器人等领域。随着深度学习在计算机视觉领域的快速发展与大规模人脸表情数据集的建立,以及日益增长的计算资源,使得提出更高准确率的人脸表情识别深度神经网络模型成为可能。本文以自然环境人脸表情数据集RAF-DB为基础,开展基于深度学习的表情识别方法研究,主要包含以下三个方面: 1.基于特征融合的表情识别。针对表情识别的任务特点,使用度量学习的思想设计了具有针对性的损失函数,并使用特征融合的基本模块残差模块与稠密模块组合成4个神经网络。使用自然环境人脸数据集训练神经网络,验证了损失函数的有效性,并在共6个神经网络中找到表情识别效果较好的网络。 2.基于注意力机制的表情识别。提出一种兼具两种感受野的通道注意力机制,该注意力机制能够通过训练学习选择哪种感受野,并加权到该感受野特征的通道中,用于加强网络对关键区域的预测。利用软阈值函数,提出一种用于特征降噪的注意力机制,用于减小非目标特征的干扰。并通过实验,获取到两种注意力机制的最优结构与嵌入到特征融合模块的最佳方式,进一步提高了表情识别的准确率。 3.基于轻量级网络的表情识别。对于残差模块和稠密模块分别提出了一种轻量化方法,该方法可以保证模块提取到的特征拥有足够大的感受野,并保证模块内的特征处在一个高维状态下,加强了特征的表达能力,增强了激活函数的非线性能力。通过对网络的轻量化,减小了网络的体积,并进一步提高了表情识别的准确率。使用L1范数法和几何中心法对轻量化后的网络进行剪枝,进一步减小了网络的体积。