摘要
行人检测技术结合行人跟踪和行为分析等技术,可广泛应用在交通、安防和机器交互等与人们生活息息相关的领域,但行人的多尺度变化一直是行人检测的难点.针对传统RetinaNet算法在多尺度行人检测过程中存在的误检、漏检和检测精度低等缺陷,提出一种改进的RetinaNet算法来提升网络模型的检测能力.主要有以下两方面创新:首先,为了获取到更多的语义信息,采用多分支结构来扩展网络,以提取不同深度下不同感受野的特征;其次,为了使模型更关注行人特征的重要信息,在模型预测头部分嵌入双池化注意力机制,增强通道间特征信息的相关性,抑制不重要的信息,以提高模型的检测精度.在COCO等不同的数据集上进行实验,结果表明,与传统的RetinaNet模型相比,所提出的模型在各个评价指标上均有所提升,具有良好的性能,可以满足行人检测的需要.