首页|基于深度神经网络的人群密度估计算法研究

基于深度神经网络的人群密度估计算法研究

郭利欣

基于深度神经网络的人群密度估计算法研究

郭利欣1
扫码查看

作者信息

  • 1. 内蒙古科技大学
  • 折叠

摘要

当今时代的社会发展速度迅猛,人工智能技术正处在一个急速发展上升的时期。计算机视觉作为人工智能的子领域,在医学、工业、农业、汽车、服务业等行业中应用十分广泛。其中人群密度估计与人群计数是智能监控领域中核心任务之一,其具体主要是根据智能监控设备采集到的视频或图像数据,利用计算机强大的算力与计算机视觉领域的相关算法,对视频数据中的人群密度分布与数量进行实时的监控与分析,避免事故发生。本文主要工作如下: (1)本文基于CANNet网络进行改进,提出了两种分别为上下文语义卷积块注意力机制网络(CA-CBAN,Context-AwareConvolutionalBlockAttentionNetwork)与上下文语义信息空间方向注意力机制网络(CAI-CAN,Context-AwareInformationCoordinateAttentionNetwork)人数计数网络模型,分别引入了卷积块注意力机制与空间方向注意力机制用于提升网络性能。并在CANNet网络基础上进行改进,在上下文尺度信息提取模块中加入了两组不同大小的池化核获取更多的人头尺度语义信息。通过实验验证CA-CBAN、CAI-CAN网络在与其他主流算法的对比中都表现出了优异性能。其中CAI-CAN网络在ShanghaiTech、UCF_CC_50、JHU_CROWD++数据集中的MAE与MSE都达到了最优。证明了所提出方法的优越性、稳定性。 (2)本文在人群计数与密度估计的基础上,进一步对人群定位任务进行研究。本文基于焦点反距离变换图(FIDTM,FocalInverseDistanceTransformMaps)对人群定位任务进行进一步研究。相较于基于高斯核生成的密度图,焦点反距离变换图在人群极度拥挤的场景更能反映出人群的具体位置信息。使用本文提出的CAI-CAN网络作为人群定位算法中焦点反距离变换图的回归器获得预测密度图,通过LMSD模块与K近邻算法分别得到人群定位点图与人头定位框图。在ShanghaiTech与UCF_QNRF两个公开数据集上进行实验,结果证明了所提出方法有较高的准确、有效和鲁棒性。另外,对所提方法进行了实际场景的应用,对包头火车站、内蒙古科技大学校园里拍摄的密集人群视频进行了人群定位测试,进一步验证了本文算法的可行性。

关键词

计算机视觉/人群计数/注意力机制/密度图/人群定位

引用本文复制引用

授予学位

硕士

学科专业

电子与通信工程

导师

李建军

学位年度

2023

学位授予单位

内蒙古科技大学

语种

中文

中图分类号

TP
段落导航相关论文