面向时空特征融合的GSTIN动作识别网络

扫码查看

原文链接

国家科技期刊平台
NETL
NSTL
万方数据
维普

中文摘要：视频动作识别是计算机视觉领域一个十分具有挑战性的课题,主要任务是利用深度学习等视频智能分析技术识别的深层信息推导出视频人体行为动作.通过结合双流卷积神经网络和三维卷积神经网络的结构特点,提出了一种面向时空特征融合的GSTIN(GoogLeNet based on spatio-temporal intergration network).GSTIN中设计了时空特征融合模块InBST(inception blend spatio-temporal feature),提升网络对空间特征与时间特征的利用能力;在时空特征融合模块InBST基础上,构建了适合动作识别的多流网络结构.GSTIN在动作识别数据集UCF101、HMDB51上识别精度分别达到了93.8％和70.6％,这表明GSTIN与其他动作识别网络相比具有较好的识别性能.

外文标题：GSTIN with spatiotemporal feature fusion for video action recognition

作者：

李克文、张震涛、李素杰、雷永秀

展开 >

作者单位：

中国石油大学(华东)计算机科学与技术学院,山东青岛266580

中国石化管道储运有限公司,江苏徐州221008

关键词：

深度学习动作识别双流卷积神经网络三维卷积神经网络时空特征融合

基金：

项目编号：

5199136161673396

出版年：

2021

DOI：

10.19734/j.issn.1001-3695.2020.08.0392

计算机应用研究

四川省电子计算机应用研究中心

计算机应用研究

CSTPCDCSCD北大核心

影响因子：0.93

ISSN：1001-3695

年,卷(期)：2021.38(8)

参考文献量5