计算机应用2023,Vol.43Issue(z1) :8-14.DOI:10.11772/j.issn.1001-9081.2022060936

基于马赛克自编码器的多场景行人检测优化方法

Multi-scenario pedestrian detection optimization method based on masked autoencoder

丁正彦 尚岩峰 王勇
计算机应用2023,Vol.43Issue(z1) :8-14.DOI:10.11772/j.issn.1001-9081.2022060936

基于马赛克自编码器的多场景行人检测优化方法

Multi-scenario pedestrian detection optimization method based on masked autoencoder

丁正彦 1尚岩峰 1王勇1
扫码查看

作者信息

  • 1. 公安部第三研究所 物联网技术研发中心,上海 201204
  • 折叠

摘要

现阶段多场景下的行人检测模型存在的主要问题在于训练数据样本多样性不足,在开放的测试环境下效果较差,不同场景之间存在数据鸿沟.针对上述问题,提出了一种基于马赛克自编码器(MAE)的多场景行人检测优化方法.首先,采用随机生成方法对原始训练数据进行自动扩充;然后,围绕数据、模型和结果等重要影响因素,分别对检测模型训练前中后三个阶段进行优化;最后,实现从通用大模型到专用小任务的自适应迁移.实验结果表明,在不增加额外标注数据的情况下,在多个公开数据集之间进行场景迁移,以常用的Caltech Pedestrian作为目标数据集,与当前最优结果Pedestron方法对比,在Reasonable、Small和Heavy子数据集上的每张图片误检率(FPPI)分别下降0.4个百分点、0.7个百分点和2.6个百分点,从而验证了模型泛化性的显著提升;另一方面,针对实际应用构建多场景行人检测数据集,验证集的平均准确率(AP)提升1.9个百分点,进一步验证MAE生成数据对模型准确性的提升作用.

关键词

多场景/行人检测/马赛克自编码器/数据增强/迁移学习

Key words

multi-scenario/pedestrian detection/Masked AutoEncoder(MAE)/data augmentation/transfer learning

引用本文复制引用

基金项目

上海市青年科技英才扬帆计划项目(20YF1409300)

出版年

2023
计算机应用
中国科学院成都计算机应用研究所

计算机应用

CSTPCDCSCD北大核心
影响因子:0.892
ISSN:1001-9081
参考文献量2
段落导航相关论文