信息技术与信息化2024,Issue(6) :64-67.DOI:10.3969/j.issn.1672-9528.2024.06.014

面向人群计数的U型Transformer模型

王锐 姚瑞玲 席茜 张冬松 毛凤翔
信息技术与信息化2024,Issue(6) :64-67.DOI:10.3969/j.issn.1672-9528.2024.06.014

面向人群计数的U型Transformer模型

王锐 1姚瑞玲 1席茜 2张冬松 1毛凤翔1
扫码查看

作者信息

  • 1. 信阳学院 河南信阳 464000
  • 2. 河南省信阳市南湾水库事务中心 河南信阳 464000
  • 折叠

摘要

在人群计数领域,可采用U型结构的全卷积神经网络模型将人群场景图映射为人群密度图.在映射的过程中,引入空间注意力机制和通道注意力机制,分别从空间维度和通道维度提取人群场景图的重要信息和抑制非重要信息.根据该思想,设计了一种基于通道和空间注意力机制的U型Transformer模型(SC U-Transformer).SC U-Transformer包含编码和解码过程,编码过程使用Swin-Transformer作为编码器,提取上下文特征并实现下采样;解码过程使用包含扩展图像块的对称Swin-Transformer模型,并添加了空间注意力模块和通道注意力模块,分别使模型更加关注前景和相关联的特征通道.根据ShanghaiTech数据集和UCF_CC_50 的实验结果可知,SC U-Transformer能够将人群场景图转换为高质量的人群密度图.

关键词

人群计数/人群场景图/人群密度图/Swin-Transformer/注意力机制

引用本文复制引用

出版年

2024
信息技术与信息化
山东电子学会

信息技术与信息化

影响因子:0.29
ISSN:1672-9528
段落导航相关论文