基于改进YOLOv7的手势识别算法研究

刘醒政¹

扫码查看

作者信息

1. 安徽理工大学
折叠

摘要

近年来，随着计算机技术与人工智能应用领域的不断发展，手势识别技术广泛应用于康复医学、视频监控识别、虚拟现实等领域。然而，手势识别存在目标较小、背景颜色接近以及参数量较大等问题，导致手势识别的精度与速度未能达到令人满意的效果。针对上述问题，本文提出了两种改进的YOLOv7手势识别算法(SC-YOLOv7,FM-YOLOv7),其主要研究内容如下: (1)针对复杂背景下，手势识别存在目标较小、背景颜色接近等问题。本文设计了SelectiveKernelSpatialPyramidPooling(SKSPP)模块,使网络在特征融合时更加侧重于对识别有用的通道，并选择最优的卷积算子，以提升手势识别性能。此外在颈部网络引入CBAM注意力机制，使得在网络层深度、宽度以及图像分辨率保持不变的情况下，获取更多有用特征，进一步改善手势识别性能。在YOLOv7基础上利用上述两个模块构建了SC-YOLOv7网络，相较于改进前，SC-YOLOv7在NUS-Ⅱ数据集上的mAP提高了3.1％,显著提高了网络的识别精度。 (2)针对现有网络参数量大、检测速度较慢等问题。本文在YOLOv7基础上，提出了FM-YOLOv7算法。首先，使用Sandglass瓶颈块替换MobileNet中的残差块(InvertedResidualblock),构建轻量级骨干网络F-MobileNet,利用少量的网络参数提高网络的特征表达能力。其次，在颈部网络引入轻量级特征融合模块LightweightCross-correlationModule(LCCM),用于聚合来自不同卷积层的交叉分辨率特征。最后，提出一种轻量级检测头DetectionHead,解决YOLOv7中检测头参数量过多的问题。与YOLOv7相比，FM-YOLOv7的FPS提高了32.9,大幅度提高了网络的检测速度。

关键词

手势识别/YOLOv7/特征融合/注意力机制/轻量化算法

引用本文复制引用

授予学位

硕士

学科专业

计算机技术

导师

周华平

学位年度

2023

学位授予单位

安徽理工大学

语种

中文

中图分类号

段落导航