首页|基于ViT的视频相似度评估及同源片段定位模型

基于ViT的视频相似度评估及同源片段定位模型

扫码查看
视频版权问题面临巨大挑战.基于视频检索数据集CC_WEB_VIDEO与视频部分拷贝检测数据集VCDB,结合Vision Transformer、注意力机制等技术,对复杂时间、空间视频的相似性进行研究,提出基于ViT的视频细粒度相似性评估模型,使用基于图的视频重复片段定位算法定位同源片段,并在实验数据集上验证了该模型的有效性.
Video similarity evaluation and homologous segment localization model based on ViT

video similarity evaluationvideo homologous segment localizationVision Transformerspatiotemporal separated attention mechanism

姜家皓、张易诚、康宇哲、沈炜

展开 >

浙江理工大学信息科学与工程学院,杭州 浙江 310018

浙江理工大学计算机科学与技术学院

视频相似性评估 视频同源片段定位 Vision Transformer 时空分离注意力机制

2023

计算机时代
浙江省计算技术研究所 浙江省计算机学会

计算机时代

影响因子:0.411
ISSN:1006-8228
年,卷(期):2023.(10)
  • 1
  • 11