超像素条件随机场下的RGB-D视频显著性检测

RGB-D video saliency detection via superpixel-level conditional random field

扫码查看

原文链接

NETL
NSTL
维普
万方数据

中文摘要：目的视觉显著性在众多视觉驱动的应用中具有重要作用,这些应用领域出现了从2维视觉到3维视觉的转换,从而基于RGB-D数据的显著性模型引起了广泛关注.与2维图像的显著性不同,RGB-D显著性包含了许多不同模态的线索.多模态线索之间存在互补和竞争关系,如何有效地利用和融合这些线索仍是一个挑战.传统的融合模型很难充分利用多模态线索之间的优势,因此研究了RGB-D显著性形成过程中多模态线索融合的问题.方法提出了一种基于超像素下条件随机场的RGB-D显著性检测模型.提取不同模态的显著性线索,包括平面线索、深度线索和运动线索等.以超像素为单位建立条件随机场模型,联合多模态线索的影响和图像邻域显著值平滑约束,设计了一个全局能量函数作为模型的优化目标,刻画了多模态线索之间的相互作用机制.其中,多模态线索在能量函数中的权重因子由卷积神经网络学习得到.结果实验在两个公开的RGB-D视频显著性数据集上与6种显著性检测方法进行了比较,所提模型在所有相关数据集和评价指标上都优于当前最先进的模型.相比于第2高的指标,所提模型的AUC(area under curve),sAUC(shuffled AUC),SIM(similarity),PCC(Pearson correlation coefficient)和NSS(normalized scanpath saliency)指标在IRCCyN数据集上分别提升了2.3％,2.3％,18.9％,21.6％和56.2％;在DML-iTrack-3D数据集上分别提升了2.0％,1.4％,29.1％,10.6％,23.3％.此外还进行了模型内部的比较,验证了所提融合方法优于其他传统融合方法.结论本文提出的RGB-D显著性检测模型中的条件随机场和卷积神经网络充分利用了不同模态线索的优势,将它们有效融合,提升了显著性检测模型的性能,能在视觉驱动的应用领域发挥一定作用.

作者：

李贝、杨铀、刘琼

展开 >

作者单位：

华中科技大学电子信息与通信学院,武汉430074

关键词：

RGB-D显著性显著性融合条件随机场(CRF) 全局能量函数卷积神经网络(CNN)

基金：

国家自然科学基金国家自然科学基金国家重点研发计划项目

项目编号：

91848107619712032017YFC0806202

出版年：

2021

中国图象图形学报

中国科学院遥感应用研究所,中国图象图形学学会 ,北京应用物理与计算数学研究所

中国图象图形学报

CSTPCDCSCD北大核心

影响因子：1.111

ISSN：1006-8961

年,卷(期)：2021.26(4)

被引量2
参考文献量7