首页|基于卷积神经网络和注意力机制的人群计数算法研究

基于卷积神经网络和注意力机制的人群计数算法研究

扫码查看
随着城市人口的迅速增长,公共场所和交通枢纽的人流密度逐渐增加,在突发事件下如何精确地估计这些公共场所的人群数量,已成为公共安全和社会管理等领域所面临的重要问题。尽管在过去几年中,计算机视觉和深度学习技术的快速发展促进了人群计数方法的进步,但仍然存在许多挑战。一方面,受图像收集设备角度、位置的不同,场景中人群存在较大的尺度差异、分布不均及背景干扰等问题。另一方面,在一些无约束的场景中,如黑夜、暴雨和大雾等情况下,行人几乎是不可见的,因此在这种较差的成像条件下,需要依靠其它模态的信息。针对上述问题,主要的研究内容和贡献如下: 针对人群计数工作中存在的人群尺度变化、分布不均及背景干扰难题,给出了一种基于通道空间注意力机制融合的人群计数算法。具体来说,该算法由两个部分组成:使用通道空间注意力机制融合采样层的前端网络和使用扩张卷积模块的后端网络。其中前端网络使用的采样层融合方法,通过通道空间注意力机制重新分配通道空间权重,来解决人群尺度变化、行人分布不均及背景干扰问题。后端网络中使用的扩张卷积模块,其输出包含丰富的空间和全局信息,有利于输出高质量的密度图。实验结果表明该方法可以降低计数误差。 针对人群尺度变化、行人分布不均及较差的成像条件等,提出了一种基于RGB-T图像的多模态人群计数算法,称为双流残差扩张网络。该网络由前端特征提取网络、多尺度的残差扩张卷积模块和全局注意力模块构成。其中,前端网络用来提取RGB特征和热特征,扩张卷积模块用来捕获不同尺度的行人特征,全局注意力模块用来建立全局特征之间的依赖关系。利用残差扩张卷积模块和引入的全局注意力模块,解决了RGB信息和热信息融合以及尺度变化、行人分布不均问题,实现了高性能的人群计数。此外为了进一步提高算法的准确性和鲁棒性,设计了一种新的多尺度差异性损失,并与欧几里德损失进行加权结合。可以更加有效的计算预测值与真值之间在不同尺度上的差距,有助于网络生成更高质量的密度图,提高算法的计数性能。实验结果表明该方法可以提高计数的准确性和鲁棒性。

杨佩龙

展开 >

人群计数 卷积神经网络 注意力机制 RGB-T图像 扩张卷积

硕士

计算机应用技术

邹凌;陈树越

2023

常州大学

中文

TP