首页期刊导航|中国图象图形学报
期刊信息/Journal information
中国图象图形学报
中国图象图形学报

李小文

月刊

1006-8961

jig@irsa.ac.cn

010-64807995 8261442

100101

北京9718信箱

中国图象图形学报/Journal Journal of Image and GraphicsCSCD北大核心CSTPCD
查看更多>>本刊是集计算机图象图形高科技理论与应用研究成果、成果产品化与商情动态于一体的综合性学术期刊。是核心期刊、权威性杂志。作为中国图象图形学学会的会刊,利用学会在国内外广泛的科技信息渠道、全方位多层面的学科交叉应用,积极向产业界宣传科技成果,热心向科技界推荐最新产品。
正式出版
收录年代

    NeurIPS 2020观察与分析

    林宙辰王奕森
    229-244页
    查看更多>>摘要:神经信息处理系统大会(Conference on Neural Information Processing Systems,NeurIPS)是机器学习领域的顶级会议,在中国计算机学会(China Computer Federation,CCF)推荐国际学术会议中被评为人工智能领域的A类会议,一直广受关注.NeurIPS 2020收到了创纪录的9 467篇投稿,最终录用1 898篇论文.收录的论文涵盖了人工智能的各种主题,包括深度学习及其应用、强化学习与规划、纯理论研究、概率方法、优化及机器学习与社会等.本文回顾了NeurIPS 2020的亮点及论文录用情况,详细解读了特邀报告、最佳论文、口头报告及部分海报论文,希望能帮助读者快速了解NeurIPS 2020的盛况.

    人工智能机器学习深度学习强化学习理论优化学术会议NeurIPS2020

    深度神经网络结构搜索综述

    唐浪李慧霞颜晨倩郑侠武...
    245-264页
    查看更多>>摘要:深度神经网络在图像识别、语言识别和机器翻译等人工智能任务中取得了巨大进展,很大程度上归功于优秀的神经网络结构设计.神经网络大都由手工设计,需要专业的机器学习知识以及大量的试错.为此,自动化的神经网络结构搜索成为研究热点.神经网络结构搜索(neural architecture search,NAS)主要由搜索空间、搜索策略与性能评估方法3部分组成.在搜索空间设计上,出于计算量的考虑,通常不会搜索整个网络结构,而是先将网络分成几块,然后搜索块中的结构.根据实际情况的不同,可以共享不同块中的结构,也可以对每个块单独搜索不同的结构.在搜索策略上,主流的优化方法包含强化学习、进化算法、贝叶斯优化和基于梯度的优化等.在性能评估上,为了节省计算时间,通常不会将每一个网络都充分训练到收敛,而是通过权值共享、早停等方法尽可能减小单个网络的训练时间.与手工设计的网络相比,神经网络结构搜索得到的深度神经网络具有更好的性能.在Ima-geNet分类任务上,与手工设计的MobileNetV2相比,通过神经网络结构搜索得到的MobileNetV3减少了近30%的计算量,并且top-1分类精度提升了3.2%;在Cityscapes语义分割任务上,与手工设计的DeepLabv3+相比,通过神经网络结构搜索得到的Auto-DeepLab-L可以在没有ImageNet预训练的情况下,达到比DeepLabv3+更高的平均交并比(mean intersection over union,mIOU),同时减小一半以上的计算量.神经网络结构搜索得到的深度神经网络通常比手工设计的神经网络有着更好的表现,是未来神经网络设计的发展趋势.

    人工智能计算机视觉深度神经网络强化学习进化算法神经网络结构搜索(NAS)

    无参考图像质量评价研究进展

    方玉明眭相杰鄢杰斌刘学林...
    265-286页
    查看更多>>摘要:图像质量评价一直是图像处理和计算机视觉领域的一个基础问题,图像质量评价模型也广泛应用于图像/视频编码、超分辨率重建和图像/视频视觉质量增强等相关领域.图像质量评价主要包括全参考图像质量评价、半参考图像质量评价和无参考图像质量评价.全参考图像质量评价和半参考图像质量评价分别指预测图像质量时参考信息完全可用和部分可用,而无参考图像质量评价是指预测图像质量时参考信息不可用.虽然全参考和半参考图像质量评价模型较为可靠,但在计算过程中必须依赖参考信息,使得应用场景极为受限.无参考图像质量评价模型因不需要依赖参考信息而有较强的适用性,一直都是图像质量评价领域研究的热点.本文主要概述2012-2020年国内外公开发表的无参考图像质量评价模型,根据模型训练过程中是否需要用到主观分数,将无参考图像质量评价模型分为有监督学习和无监督学习的无参考图像质量评价模型.同时,每类模型分成基于传统机器学习算法的模型和基于深度学习算法的模型.对基于传统机器学习算法的模型,重点介绍相应的特征提取策略及思想;对基于深度学习算法的模型,重点介绍设计思路.此外,本文介绍了图像质量评价在新媒体数据中的研究工作及图像质量评价的应用.最后对介绍的无参考图像质量评价模型进行总结,并指出未来可能的发展方向.

    图像质量评价人类视觉系统视觉感知自然统计特征机器学习深度学习

    轨道病害视觉检测:背景、方法与趋势

    王建柱李清勇张靖甘津瑞...
    287-296页
    查看更多>>摘要:铁路作为国家重要基础设施、国民经济大动脉和大众化运输方式,对社会经济发展起着不可替代的支撑作用.轨道是铁路系统的重要组件,轨道病害检测是铁路工务部门的核心业务.传统的人工巡检不仅费时费力,而且检测结果容易受到各种主观因素的影响.因此,自动化轨道病害检测对维护铁路运输安全具有重要的现实意义.考虑到视觉检测在速度、成本和可视化等方面的优势,本文聚焦于轨道病害视觉检测技术.首先以广泛应用的无砟轨道为例介绍轨道的基本结构,对常见的轨道表观病害进行样例展示、成因分析和影响评价;简要梳理常见的自动化轨道检测技术的基本原理和应用场景,对轨道病害视觉检测面临的图像质量不均、可用特征较少和模型更新困难等主要挑战进行归纳;然后,依照前景模型、背景模型、盲源分离模型及深度学习模型的分类逻辑对轨道病害视觉检测领域的研究现状进行综述,简要介绍了各类方法的代表性工作,总结了各类方法的技术特点与应用局限性;最后,针对智能化铁路的发展需求,展望了未来轨道病害视觉检测技术的研究趋势,即利用小样本/零样本学习、多任务学习与多源异构数据融合等技术手段来解决当前视觉检测系统中的鲁棒性弱、虚警率高等问题.

    轨道病害视觉检测前景背景盲源分离深度学习

    RMFS-CNN:遥感图像分类深度学习新框架

    赵雪梅吴军陈睿星
    297-304页
    查看更多>>摘要:现有卷积神经网络(convolutional neural network,CNN)利用卷积层和激活函数的叠加,构建复杂非线性函数拟合输入数据到输出标签的转换关系,这种端到端的学习方式严重影响了CNN特征图与先验知识的融合,导致其对训练样本数量和质量敏感,同时增加了CNN特征图可解释性难度.本文从深度学习建模方式角度出发,以遥感图像特征表达及其可解释性为切入点,搭建传统遥感图像先验知识与CNN的桥梁,分析阐述了黎曼流形特征空间(Riemannian manifold feature space,RMFS)对CNN可解释性、特征演化规律等方面的促进作用;提出融合CNN与RMFS构建RMFS-CNN遥感图像分类新框架,以RMFS为特征过渡平台,一方面利用其线性特征分布规律降低CNN对传统图像特征的学习难度,另一方面定义能够突显图像先验知识的表达范式,提高CNN对可解释性特征的学习能力,以达到利用RMFS对先验知识(特征)表达的优异性能提高CNN遥感图像分类特征利用效率的目的;以RMFS特征表达范式为基础定义控制CNN特征学习偏好的损失函数,进而发展具有良好特征解释性的CNN分类模型及可控的模型训练方法;最后指出构建RMFS-CNN分类框架的可行性及该框架对遥感图像分类和深度学习理论发展方面的理论贡献与应用价值.

    遥感图像分类深度学习卷积神经网络黎曼流形特征空间特征表达特征定制模型训练

    深度学习在医学影像智能处理中的应用与挑战

    左艳黄钢聂生东
    305-315页
    查看更多>>摘要:利用深度学习方法对医学影像数据进行处理分析,极大地促进了精准医疗和个性化医疗的快速发展.深度学习在医学图像领域的应用较为广泛,具有多病种、多模态、多组学和多功能的特点.为便于对深度学习在医学图像处理领域的应用进行更深入有效的探索,本文系统综述了相关研究进展.首先,从深度学习在影像基因组学中的应用出发,理清了深度学习在医学影像领域应用的一般思路和现状,将医学影像领域分为智能诊断、疗效评估和预测预后等3个模块,并对模块内的各病种进行总结,展示了深度学习各算法的优缺点及面临的问题和挑战.其次,对深度学习中出现的新思路、新方法以及对传统方法的改进进行了阐述.最后,总结了该领域现阶段面临的问题,并对未来的研究方向做出了展望.基于深度学习的医学图像智能处理与分析虽然取得了一些有价值的研究成果,但还需要根据临床的实际需求,将深度学习与经典的机器学习算法及无创并且高效的多组学数据结合起来,对深度学习的理论和方法进行深入研究.

    医学图像处理人工智能深度学习影像基因组学精准医疗

    视频车辆黑烟检测算法研究进展

    张天琪杨伟东张姣姣彭凯...
    316-333页
    查看更多>>摘要:黑烟车辆逐渐成为城市的主要污染源之一,针对黑烟的视频车辆检测方法具有效果好、成本低、应用面广和不妨碍交通等优点,但是仍存在误检率高、新方法可解释性差的缺陷.为了总结归纳视频黑烟检测算法的研究进展,本文对2016-2019年公开发表的文献进行总结.视频黑烟检测框架按顺序可以分为监控视频预处理、疑似黑烟区域选取、黑烟特征选取、分类识别和算法性能分析几部分,而且此顺序可以根据实际情况微调.本文介绍了视频黑烟检测框架,从层次的角度分析了疑似黑烟区域提取和黑烟特征选取.疑似黑烟区域提取方法由低到高依次分为图像级提取、目标级提取、像素级提取和纯黑烟重构等4个层次,提取方法的精细度与稳定性逐步上升,而且高层次方法一般可以应用在低层次方法的结果上.黑烟特征按基于学习的非线性映射次数划分为底层特征、中层特征和高层特征等3个层次,分界点是1次和3次.随着层次的提高,特征表达力就会越强,但二者之间并不是严格的线性关系.然后从可解释性的角度重点介绍了高层特征.另外,本文从有、无深度学习的角度归纳了特征提取算法,之后从传统方法与深度方法两方面归纳了常见的分类识别方法.最后介绍了主流算法评价指标.针对视频黑烟检测算法的几个特点,对其未来发展方向进行了总结归纳.

    黑烟车辆检测特征提取烟雾识别深度学习可解释性综述

    单幅图像刚体目标姿态估计方法综述

    杨步一杜小平方宇强李佩阳...
    334-354页
    查看更多>>摘要:刚体目标姿态作为计算机视觉技术的重点研究方向之一,旨在确定场景中3维目标的位置平移和方位旋转等多个自由度,越来越多地应用在工业机械臂操控、空间在轨服务、自动驾驶和现实增强等领域.本文对基于单幅图像的刚体目标姿态过程、方法分类及其现存问题进行了整体综述.通过利用单幅刚体目标图像实现多自由度姿态估计的各类方法进行总结、分类及比较,重点论述了姿态估计的一般过程、估计方法的演进和划分、常用数据集及评估准则、研究现状与展望.目前,多自由度刚体目标姿态估计方法主要针对单一特定应用场景具有较好的效果,还没有通用于复合场景的方法,且现有方法在面对多种光照条件、杂乱遮挡场景、旋转对称和类间相似性目标时,估计精度和效率下降显著.结合现存问题及当前深度学习技术的助推影响,从场景级多目标推理、自监督学习方法、前端检测网络、轻量高效的网络设计、多信息融合姿态估计框架和图像数据表征空间等6个方面对该领域的发展趋势进行预测和展望.

    计算机视觉单幅图像刚体目标姿态估计深度学习

    流体运动估计光流算法研究综述

    邵绪强杨艳刘艺林
    355-367页
    查看更多>>摘要:对流体图像序列进行运动分析一直是流体力学、医学和计算机视觉等领域的重要研究课题.从图像对中提取的密集精确的速度矢量场能够为许多领域提供有价值的信息,基于光流法的流体运动估计技术因其独特的优势成为一个有前途的方向.光流法可以获得具有较高分辨率的密集速度矢量场,在小尺度精细结构的测量上有所改进,弥补了基于相关分析法的粒子图像测速技术的不足.此外,光流方法还可以方便的引入各种物理约束,获得较为符合流体运动特性的运动估计结果.为了全面反映基于光流法的流体运动估计算法的研究进展,本文在广泛调研相关文献的基础上,对国内外具有代表性的论文进行了系统阐述.首先介绍了光流法的基本原理,然后将现有算法按照要解决的突出问题进行分类:结合流体力学知识的能量最小化函数,提高对光照变化的鲁棒性,大位移估计和消除异常值.对每类方法,从问题解决过程的角度予以介绍,分析了各类突出问题中现有算法的特点和局限性.最后,总结分析了流体运动估计技术当前面临的问题和挑战,并对未来基于光流法的运动估计算法的研究方向和研究重点进行了展望.

    流体运动估计光流法流体力学光照变化大位移估计异常值检测

    帧内块复制中的位移矢量参数编码算法

    赵利平林涛杨玉芬胡珂立...
    368-377页
    查看更多>>摘要:目的 随着云计算和移动互联网技术的飞速发展,屏幕图像编码已成为视频压缩领域新的研究热点.帧内块复制(intra block copy,IBC)算法是屏幕内容编码(screen content coding,SCC)中的核心算法,已经成为高效视频编码(high efficiency video coding,HEVC)等标准中屏幕内容编码的重要组成部分.为了进一步消除IBC算法中的位移矢量(displacement vector,DV)参数编码的冗余,根据DV参数具有的固有帧内块匹配特性和相关性,提出了一种DV参数编码算法.方法 首先,对待编码DV采用邻近块与最近块相结合的DV预测编码方案,进一步提高DV的预测编码效率;然后,对预测编码效率不高的DV,提出了一种基于区域划分与调整的高效DV直接编码方案.对SCC标准测试数据集合中的17个测试数据集合的3种编码配置从编码效率和复杂度两方面进行了评测.结果 实验结果表明,对于SCC标准测试数据集合中移动的文字和图形序列类别,在全帧内、随机接入和低延迟这3种有损编码配置下,提出的DV算法与HEVC SCC中的IBC算法相比,在编解码复杂度没有任何影响的前提下,Y分量的BD(Bjøntegaard Delta)-rate平均降低率分别为1.04%、0.87%和0.93%,全帧内配置下Y分量的BD-rate降低率可达2.99%.结论 本文方法优于HEVC-SCC中的IBC算法中的DV编码算法,能有效提升编码效率.

    高效视频编码(HEVC)数字音视频编解码屏幕内容编码位移矢量预测编码直接编码