在生活中,某些特定的场景会对人的行为做出特定的限制.比如加油站禁止抽烟、打电话,驾驶时禁止抽烟等.由于难以监管,近年来这些违规行为频繁发生,对社会造成很大的危害.传统方法采用人工全天候利用摄像头查看或者派专人监督,效率十分低下.本文提出Efficient Video Swin Transformer用于实时抽烟、打电话动作识别,与现有方法相比取得较好效果.同时提出了一套可工程化落地运用的在线动作识别框架.
Action Recognition Algorithm for Smoking and Calling in Complex Scenes