首页|融合移位窗口注意力的光流计算方法

融合移位窗口注意力的光流计算方法

扫码查看
针对端到端的光流计算方法容易受限于运动模糊、遮挡和大位移的问题,通过引入注意力机制实现对遮挡像素进行更准确的预测,提出一种融合移位窗口注意力的光流计算方法。首先使用移位窗口注意力对原有的特征图进行特征增强,获取更具全局自相似性的特征,弥补了卷积特征的局部性特点;然后使用移位窗口注意力进行相关体解析,包括2D运动向量解析和光流增量的计算,获得更准确的光流增量;最后引入遮挡图作为位置编码,在计算注意力时考虑更多的像素位置关系。实验结果表明,在Sintel数据集上,端到端的误差达到1。33;在FlyingChairs数据集上,单帧计算时间为69ms,比全局运动聚合方法减少4。2%,超过了常见光流计算方法的精度和效率。
Optical Flow Estimation Method with Shifted Windows Transformer
A fusion optical flow estimation method combining shifted windows Transformer(SWin)and convolution is proposed to address the problems of motion blur,occlusion and large displacement,which leads to more accurate results on occluded areas.Firstly,original feature map is processed by SWin to get the enhanced features which include more self-similarities between pixels and makes up for the local character-istics of convolution features;Then,correlation volume is parsed by SWin to get more accurate flow incre-ment which include 2D motion feature parse and flow increment calculation;Finally,occlusion map is in-troduced to calculate the position embedding,which brings more pixel relationship to the calculation of at-tention.End point error on Sintel is 1.33;Average reference time on FlyingChairs is 69ms,4.2%lower than Global Motion Aggregation,which outperforms common optical flow estimation methods.

optical flow estimationself-attention mechanismshifted windows Transformerpositional encoding

安峰、戴军、韩振

展开 >

苏州工业园区服务外包职业学院智能制造学院 苏州 215123

同济大学经济与管理学院 上海 210092

光流计算 自注意力机制 移位窗口注意力 位置编码

国家自然科学基金江苏省工程中心开放基金智能感知与计算优质创新平台

71272048FMZ202018YZCXPT2023103

2024

计算机辅助设计与图形学学报
中国计算机学会

计算机辅助设计与图形学学报

CSTPCD北大核心
影响因子:0.892
ISSN:1003-9775
年,卷(期):2024.36(8)