摘要
近年来,随着计算机技术与人工智能应用领域的不断发展,手势识别技术广泛应用于康复医学、视频监控识别、虚拟现实等领域。然而,手势识别存在目标较小、背景颜色接近以及参数量较大等问题,导致手势识别的精度与速度未能达到令人满意的效果。针对上述问题,本文提出了两种改进的YOLOv7手势识别算法(SC-YOLOv7,FM-YOLOv7),其主要研究内容如下: (1)针对复杂背景下,手势识别存在目标较小、背景颜色接近等问题。本文设计了SelectiveKernelSpatialPyramidPooling(SKSPP)模块,使网络在特征融合时更加侧重于对识别有用的通道,并选择最优的卷积算子,以提升手势识别性能。此外在颈部网络引入CBAM注意力机制,使得在网络层深度、宽度以及图像分辨率保持不变的情况下,获取更多有用特征,进一步改善手势识别性能。在YOLOv7基础上利用上述两个模块构建了SC-YOLOv7网络,相较于改进前,SC-YOLOv7在NUS-Ⅱ数据集上的mAP提高了3.1%,显著提高了网络的识别精度。 (2)针对现有网络参数量大、检测速度较慢等问题。本文在YOLOv7基础上,提出了FM-YOLOv7算法。首先,使用Sandglass瓶颈块替换MobileNet中的残差块(InvertedResidualblock),构建轻量级骨干网络F-MobileNet,利用少量的网络参数提高网络的特征表达能力。其次,在颈部网络引入轻量级特征融合模块LightweightCross-correlationModule(LCCM),用于聚合来自不同卷积层的交叉分辨率特征。最后,提出一种轻量级检测头DetectionHead,解决YOLOv7中检测头参数量过多的问题。与YOLOv7相比,FM-YOLOv7的FPS提高了32.9,大幅度提高了网络的检测速度。