摘要
随着人们参加大型群体性活动的频率增加,公共场所的人群安全问题成为社会广泛关注的重点,利用智能视觉检测技术对公共场所中的人群进行状态监测和行为分析也是目前研究的热点。目前进行人群监测的方法大致分为两个方面:一是人群密度估计与人群计数,二是人群异常行为检测。对人群场景中的人群进行密度估计及计数,获取场景中的人群分布及数量信息,可防止人群因拥挤而发生踩踏等安全事故;对人群中的异常行为进行检测,可以及时发现人群中的危险信号,能够避免突发性群体事件的发生。 本文在深入分析了现有方法的基础上,构建了基于VGG-16结合膨胀卷积块的网络框架对人群密度进行估计,并且针对不同的密度等级分别利用不同方法进行人群异常行为的检测。 (1)针对人群场景中尺度变化等问题,本文针对CSRNet中VGG-16与膨胀卷积融合的人群密度估计网络做出改进,并结合与DenseASPP相似的膨胀卷积块,采用基于VGG-16结合膨胀卷积块的人群密度估计框架,首先使用去除全连接层的VGG-16网络提取人群图片的抽象特征,后端密集连接膨胀卷积模块捕获不同尺度的人群信息。此外,为了使密度估计图与真实密度图的误差更小,本文衡量了像素级和图像级两个方面的损失,釆用欧几里得损失函数与结构性损失函数结合的方式,使得估计的人群密度图更加准确。本文在ShanghaiTech与UCF_CC_50数据集上进行人群密度图估计的多组实验,与CSRNet相比,本文模型取得了更显著的MAE与RMSE,在ShanghaiTechPart_A数据集上分别下降了6.7%和9.2%,在Part_B数据集上下降了18.8%和16.2%;在UCF_CC_50数据集上分别下降了12.9%和18.6%。 (2)针对人群异常检测问题,釆用基于密度等级划分的人群异常行为分析方法,分低、高密度两个等级进行异常行为检测。对于人群稀疏场景,在AMDN网络的基础上,利用人群对象的外观与运动时空信息,采用深度网络结合OC-SVM进行人群异常行为检测;对于人群密集场景,由于人物之间遮挡严重,难以捕捉其具体的运动与外观特征,本文通过人群密度图生成密度时空块获取人群分布的时空信息,采用一种基于密度图序列时空信息的人群聚集行为检测。在UCSDPed1数据集上进行低密度场景下的帧级与像素级的评估,帧级AUC与EER分别为0.926、0.11,像素级AUC与EER分别为0.701、0.383;在Pets2009数据集上对高密度人群聚集行为进行检测,取得了较低的平均帧误差。 实验结果表明本文采用的人群密度估计网络能够生成高质量的人群密度图,实现较为精确的人群计数任务;人群异常事件检测方法也有较高的准确率。