浙江大学学报(工学版)2024,Vol.58Issue(1) :10-19.DOI:10.3785/j.issn.1008-973X.2024.01.002

混合采样下多级特征聚合的视频目标检测算法

Video object detection algorithm based on multi-level feature aggregation under mixed sampler

秦思怡 盖绍彦 达飞鹏
浙江大学学报(工学版)2024,Vol.58Issue(1) :10-19.DOI:10.3785/j.issn.1008-973X.2024.01.002

混合采样下多级特征聚合的视频目标检测算法

Video object detection algorithm based on multi-level feature aggregation under mixed sampler

秦思怡 1盖绍彦 1达飞鹏1
扫码查看

作者信息

  • 1. 东南大学自动化学院,江苏南京 210096;东南大学复杂工程系统测量与控制教育部重点实验室,江苏南京 210096
  • 折叠

摘要

针对现有基于深度学习的视频目标检测算法无法同时满足精度和效率要求的问题,在单阶段检测器YOLOX-S的基础上,提出基于混合加权采样和多级特征聚合注意力的视频目标检测算法.混合加权参考帧采样(MWRS)策略采用加权随机采样操作和局部连续采样操作,充分利用有效的全局信息与帧间局部信息.多级特征聚合注意力模块(MFAA)基于自注意力机制,对YOLOX-S提取的分类特征进行细化,使得网络从不同层次的特征中学到更加丰富的特征信息.实验结果表明,所提算法在ImageNet VID数据集上的检测精度均值AP50达到77.8%,平均检测速度为11.5ms/帧,在检测图片上的目标分类和定位效果明显优于YOLOX-S,表明所提算法达到了较高的精度,具有较快的检测速度.

关键词

机器视觉/视频目标检测/特征聚合/注意力机制/YOLOX

Key words

machine vision/video object detection/feature aggregation/attention mechanism/YOLOX

引用本文复制引用

基金项目

江苏省前沿引领技术基础研究专项(BK20192004C)

江苏高校优势学科建设工程项目()

出版年

2024
浙江大学学报(工学版)
浙江大学

浙江大学学报(工学版)

CSTPCDCSCD北大核心
影响因子:0.625
ISSN:1008-973X
参考文献量32
段落导航相关论文