计算机技术与发展2023,Vol.33Issue(4) :69-74.DOI:10.3969/j.issn.1673-629X.2023.04.010

基于注意力机制和残差网络的视频行为识别

Video Behavior Recognition Based on Attention Mechanism and Residual Network

李建平 赖永倩
计算机技术与发展2023,Vol.33Issue(4) :69-74.DOI:10.3969/j.issn.1673-629X.2023.04.010

基于注意力机制和残差网络的视频行为识别

Video Behavior Recognition Based on Attention Mechanism and Residual Network

李建平 1赖永倩1
扫码查看

作者信息

  • 1. 东北石油大学 计算机与信息技术学院,黑龙江 大庆 163318
  • 折叠

摘要

针对现有的视频人体行为识别模型识别能力有限,以及双流识别方法易受光照因素的影响导致时间成本较高的问题,提出一种基于注意力机制的ResNeXt模型用于识别视频中的人体行为.将经过预处理后的视频帧数据作为该模型的输入,该卷积网络模型使用ResNeXt101 层网络作为核心残差块.在ResNeXt三维卷积神经网络模型的基础上,通过引入注意力机制来加强重要的特征信道,提高网络模型的特性表示及稳健性.使用Kinetics的预训练模型,对UCF-101 和HMDB-51 的数据进行了训练和学习,迭代200 次后,在验证集上的识别率分别达到了96.0%和69.9%.实验结果显示,该模型能有效识别视频中的时空特征,与以往的识别模型相比准确率有所提高,且在人体行为识别任务中识别率较好.该模型能在保证深层网络的同时,使特征不丢失并且防止发生过拟合,同时识别的正确率也得到了改善,证明了该模型是有效可行的.

关键词

深度学习/残差网络/三维卷积网络/视频行为识别/注意力机制

引用本文复制引用

基金项目

国家自然科学基金重点项目(61933007)

出版年

2023
计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
参考文献量6
段落导航相关论文