摘要
伴随着现代城市规模的不断扩大,人群聚集场景频发,对公共安全提出严峻挑战。对聚集人群场景进行智能监测,实时掌握场景人数与人群空间分布,能够有效避免踩踏等安全事故的发生,极大提升公共安全防护能力。高精度计数人群规模对分析人群聚集活动和空间分布特性具有重要作用。目前,人群计数已经成为计算机视觉、人工智能等领域重要研究方向之一。早期人群计数方法普遍存在表现不佳、鲁棒性差、精度损失严重等缺陷。本文将以基于深度神经网络的人群密度图回归估计为核心架构探索相关问题解决方案。建立输入图像与人群密度图标签之间的关系,相比于早期算法在进一步提升计数准确率的情况下,更有利于人群空间分布信息的精确获取。本文具体工作如下: (1)设计搭建融合上下文信息的多尺度人群计数网络架构。在整体网络结构中,为了解决在人群图像中因透视效果造成的多尺度问题,我们设计了基于空洞卷积的多尺度特征提取模块。为了让算法更好地适应于数据集中不同图像间的复杂场景信息,我们提出了基于注意力机制的上下文信息提取模块。网络整体采用编码器-解码器结构,在解码器部分使用逐渐上采样的策略生成高质量密度图。为了在解码器中不同分辨率的特征级别上增强信息传递,我们提出了自适应密集连接。通过实验分析,我们的方法在三个主流数据集中表现出了良好的计数性能。 (2)设计提出基于相邻特征擦除与传输网络的人群计数算法,用于解决人群图像中的尺度变化问题。为了有效平衡效率和参数计算量,我们使用金字塔多级网络作为主干网络。为了解决人群图像中的复杂尺度问题,我们首次在人群计数算法中引入了相邻特征擦除与传输机制,将金字塔特征更进一步转化为尺度感知特征。我们在三个主流数据集中进行实验,并取得了有竞争力的计数效果。