摘要
随着大部分城市人口密度不断上升,大量公众场所面临许多安全问题。为了加强公共场所人员管理,实现智能化检测,有关人群计数算法的相关研究受到了越来越多研究者的关注。在现实生活中,由于针对的复杂人群场景往往面临着大量无关信息的干扰,且受到天气,光照等条件制约,人群计数算法的性能无法得到有效发挥,因此如何减少无关信号干扰,缓解透视畸变等问题的影响备受研究者的关注。近年来,为了提高人群计数的准确性和泛化性,许多优秀的算法被提出。如多阶段双通道网络和自注意力网络都能有效地提高算法有效性。 (1)针对现有人群计数场景中大量存在的无关噪声干扰和严重失真的透视的影响,设计了一种双通道多任务联合的人群计数算法网络:基于背景抑制与上下文感知的人群计数网络。该网络以VGG16进行特征提取,并采用多级特征融合的方式,提高纹理信息和语义信息的信息流动;并通过U型卷积神经网络的结构特点设计了一个图像分割模块,用于分割图像的背景和前景,从而减少背景噪声对最终生成密度图的影响。考虑到人群计数算法面对大量透视畸变的图像会导致定位偏差,因此在网络设计中引入了上下文感知增强模块,以增强特征点对周边信息的关联性,进而提高网络的泛化能力,生成高质量的人群密度图。该网络在UCF-QNRF数据集上该网络的平均绝对误差和均方误差分别为85.8、146.0,相较于其他网络最高分别下降了69.0%和67.2%,取得了显著的性能提升。 (2)现有人群计数算法中由于普遍人群分布不均,分布不规律的问题,导致算法无法在各种复杂场景中均保持有效性。针对该问题,提出了一种能根据实际场景自适应调整特征提取策略的卷积神经网络:基于自注意力的动态感知人群计数网络。该网络以VGG19作为特征提取网络,并在空间、通道上对特征图逐级细化,减少冗余信息的干扰,提高网络对人群区域的自适应关注为了减少人群分布不均和不规律对网络的检测造成的影响,通过设计的动态感知模块,自适应调整网络在不同场景下的特征提取策略,提高网络在不同场景下的适应能力,进而增强网络对前景的感知能力;同时,为了减少高度拥挤和遮挡场景中高斯密度图的误差,在训练过程中使用最优传输损失、整体损失、以及人群数量损失联合进行优化,从而提高网络的计数能力。实验结果表明,该网络在UCF-CC-50数据集上表现出色,取得了所有对比网络中最佳的性能。其平均绝对误差和均方误差分别为148.96和212.3,相比CSRNet分别下降了44.0%和46.6%,性能提升显著。 综上所述,本文主要从网络结构和损失函数两方面对人群计数算法的前景感知能力进行优化,该方法对复杂的人群场景具有更有效的检测精度和定位能力,可以实现更加复杂多变场景下的稳定计数和检测,具有更好的应用场景。