摘要
从人类对视频内容的认知机理出发,提出了一种基于对象属性关系图的视频描述方法.该方法将视频描述成一幅属性关系图,图中结点表示视频中的关键目标对象,图的边表示对象之间的相对关系.结点属性由对象的时间-空间域特征构成,对象之间关系的时间-空间变化特征作为边的属性.进一步将视频的对象属性关系图用于视频内容的相似性度量.通过采用图匹配的方法,视频的相似性度量可在一个二次分配优化问题中求解.实验结果表明:基于对象属性关系图的视频描述方法能够很好地从语义层面描述视频内容,与经典的视觉单词词袋描述方法和目前深度3D卷积网络的特征描述方法相比,在视频检索任务上具有更高的平均相似度、查准率和查全率.
基金项目
教育部人文社会科学研究青年项目(17YJCZH043)
重庆市基础科学与前沿技术研究一般项目(cstc2017jcyjAX0339)
重庆市基础科学与前沿技术研究一般项目(cstc2018jcyjAX0287)