基于ViT的视频相似度评估及同源片段定位模型
Video similarity evaluation and homologous segment localization model based on ViT
姜家皓 1张易诚 2康宇哲 1沈炜2
作者信息
- 1. 浙江理工大学信息科学与工程学院,杭州 浙江 310018
- 2. 浙江理工大学计算机科学与技术学院
- 折叠
摘要
视频版权问题面临巨大挑战.基于视频检索数据集CC_WEB_VIDEO与视频部分拷贝检测数据集VCDB,结合Vision Transformer、注意力机制等技术,对复杂时间、空间视频的相似性进行研究,提出基于ViT的视频细粒度相似性评估模型,使用基于图的视频重复片段定位算法定位同源片段,并在实验数据集上验证了该模型的有效性.
关键词
视频相似性评估/视频同源片段定位/Vision/Transformer/时空分离注意力机制Key words
video similarity evaluation/video homologous segment localization/Vision Transformer/spatiotemporal separated attention mechanism引用本文复制引用
出版年
2023