多分支结构和双池化注意力机制的RetinaNet行人检测

凌以运 ¹王智文 ¹白云 ²谢世步 ³韦秋伶 ¹何雨鲜¹

扫码查看

作者信息

1. 广西科技大学电子工程学院,广西柳州 545006
2. 柳州工学院信息科学与工程学院,广西柳州 545616
3. 广西科技大学计算机科学与技术学院,广西柳州 545006
折叠

摘要

行人检测技术结合行人跟踪和行为分析等技术,可广泛应用在交通、安防和机器交互等与人们生活息息相关的领域,但行人的多尺度变化一直是行人检测的难点.针对传统RetinaNet算法在多尺度行人检测过程中存在的误检、漏检和检测精度低等缺陷,提出一种改进的RetinaNet算法来提升网络模型的检测能力.主要有以下两方面创新:首先,为了获取到更多的语义信息,采用多分支结构来扩展网络,以提取不同深度下不同感受野的特征;其次,为了使模型更关注行人特征的重要信息,在模型预测头部分嵌入双池化注意力机制,增强通道间特征信息的相关性,抑制不重要的信息,以提高模型的检测精度.在COCO等不同的数据集上进行实验,结果表明,与传统的RetinaNet模型相比,所提出的模型在各个评价指标上均有所提升,具有良好的性能,可以满足行人检测的需要.

关键词

行人检测/RetinaNet/多分支结构/行人特征/双池化注意力机制/行人跟踪/行为分析

引用本文复制引用

出版年

2025

物联网技术

陕西省电子技术研究所

物联网技术

影响因子：0.4

ISSN：2095-1302

段落导航