首页期刊导航|中国图象图形学报
期刊信息/Journal information
中国图象图形学报
中国图象图形学报

李小文

月刊

1006-8961

jig@irsa.ac.cn

010-64807995 8261442

100101

北京9718信箱

中国图象图形学报/Journal Journal of Image and GraphicsCSCD北大核心CSTPCD
查看更多>>本刊是集计算机图象图形高科技理论与应用研究成果、成果产品化与商情动态于一体的综合性学术期刊。是核心期刊、权威性杂志。作为中国图象图形学学会的会刊,利用学会在国内外广泛的科技信息渠道、全方位多层面的学科交叉应用,积极向产业界宣传科技成果,热心向科技界推荐最新产品。
正式出版
收录年代

    均匀参与介质的渲染方法研究

    王贝贝樊家辉
    961-969页
    查看更多>>摘要:参与介质在现实世界中广泛存在,光线在参与介质中的传播过程比在表面上的传播过程更加复杂,比如在高度散射参与介质中会发生成千上万次反射、在低散射参与介质中由于表面聚集出现体焦散效果,从而使得光线的模拟过程非常耗时.目前常用的方法包括点、光束和路径统一模型法(unifying points,beams and paths,UPBP)以及流型探索梅特罗波利斯光线传递方法(manifold exploration Metropolis light transport,MEMLT)等,这些方法在一定程度上改进了原有方法,但是在一些特殊情况下仍然需要很长时间才能收敛.本文介绍几种针对均匀参与介质的高效渲染方法.1)基于点的参与介质渲染方法,主要通过在参与介质内分布一些点来分别加速单次、二次和多次散射的计算,在GPU(graphics processing unit)实现的基础上,最终达到可交互的效率,并且支持对任意的均匀参与介质的编辑.2)基于多次反射的预计算模型,预计算出无限参与介质中的多次散射分布,通过分析光照分布的对称性,将该分布的维度从4维减低为3维,并且将该分布应用到多种蒙特卡洛渲染方法中,比如MEMLT、UPBP等,从而提高效率.3)参与介质中的路径指导方法,通过学习光线在参与介质中的分布,该分布用SD-tree(spatial-directional tree)来表示,与相位函数进行重采样来产生出射方向.以上3种方法分别从不同角度加快了参与介质的渲染效率.

    参与介质渲染蒙特卡罗方法路径指导基于点的渲染方法多次散射综述进展

    布料仿真建模研究进展

    靳雁霞张晋瑞贾瑶马博...
    970-977页
    查看更多>>摘要:布料仿真一直是计算机动画中的研究热点与难点,对提高计算机动画质量以及用户体验具有重要意义,布料是一种非常经典的柔性材料物体,遍布于人们的日常生活中.虚拟世界中虚拟角色强烈的视觉真实感主要来源于逼真的虚拟人物的服装动画,这在很大程度上可以增强用户的体验感,在游戏娱乐、电影电视和动画制作等领域有着十分广泛的应用前景.布料仿真的质量与速度直接决定了计算机动画的整体水平,而布料的模拟水平则起着至关重要的作用.随着计算机软硬件的不断发展和计算机动画市场需求的提高,对布料仿真建模方法的研究受到越来越多的关注,布料仿真建模方法也因此有了较大发展.本文通过回顾布料仿真建模方法的相关工作,对国内外方法的研究进展进行综述,从布料仿真中数值积分方法的改进、多分辨率网格的改进和机器学习方法的使用等方面对布料仿真方法的发展进行简要阐述,并根据不同方法在布料模拟应用上的特性,对几大类改进方法进行了相应的总结与展望.同时选取几种算法进行对比,并给出建议.

    虚拟仿真布料仿真积分方法多分辨率网格机器学习进展

    中国图像工程:2020

    章毓晋
    978-990页
    查看更多>>摘要:本文是关于中国图像工程的年度文献综述系列之二十六.为了使国内广大从事图像工程研究和图像技术应用的科技人员能够较全面地了解国内图像工程研究和发展的现状,有针对性地查询有关文献,且向期刊编者和作者提供有用的参考,对2020年度图像工程相关文献进行了统计和分析.具体是从国内15种有关图像工程重要中文期刊在2020年发行的共154期上所发表的2 785篇学术研究和技术应用文献中,选取出813篇属于图像工程领域的文献,并根据各文献的主要内容将其分别归入图像处理、图像分析、图像理解、技术应用和综述评论5个大类,然后进一步分入23个专业小类(与前15年相同),并在此基础上分别进行各期刊与各类文献的统计和分析.根据对2020年统计数据的分析可以看出:图像分析方向当前得到了最多的关注,其中目标检测和识别、图像分割和边缘检测、人体生物特征提取和验证等都是研究的焦点.另外,遥感、雷达、声呐、测绘以及生物、医学等领域的图像技术开发和应用最为活跃.总的来说,中国图像工程在2020年的研究深度和广度还在继续提高和扩大,仍保持着快速发展的势头.综合26年的统计数据还为读者提供了更全面和更可信的各研究方向发展趋势的信息.

    图像工程图像处理图像分析图像理解技术应用文献综述文献统计文献分类文献计量学

    双阶段信息蒸馏的轻量级图像超分辨率网络

    李明鸿常侃李恒鑫谭宇飞...
    991-1005页
    查看更多>>摘要:目的 在图像超分辨率(super resolution,SR)任务中采用大尺寸的卷积神经网络(convolutional neural net-work,CNN)可以获得理想的性能,但是会引入大量参数,导致繁重的计算负担,并不适合很多计算资源受限的应用场景.为了解决上述问题,本文提出一种基于双阶段信息蒸馏的轻量级网络模型.方法 提出一个双阶段带特征补偿的信息蒸馏模块(two-stage feature-compensated information distillation block,TFIDB).TFIDB 采用双阶段、特征补偿的信息蒸馏机制,有选择地提炼关键特征,同时将不同级别的特征进行合并,不仅提高了特征提炼的效率,还能促进网络内信息的流动.同时,TFIDB引入通道关注(channel attention,CA)机制,将经过双阶段信息蒸馏机制提炼的特征进行重要性判别,增强对特征的表达能力.以TFIDB为基础构建模块,提出完整的轻量级网络模型.在提出的网络模型中,设计了信息融合单元(information fusion unit,IFU).IFU将网络各层级的信息进行有效融合,为最后重建阶段提供准确、丰富的层级信息.结果 在5个基准测试集上,在放大倍数为2时,相较于知名的轻量级网络 CARN(cascading residual network),本文算法分别获得了 0.29 dB、0.08 dB、0.08 dB、0.27 dB 和0.42 dB 的峰值信噪比(peak singal to noise ratio,PSNR)增益,且模型参数量和乘加运算量明显更少.结论 提出的双阶段带补偿的信息蒸馏机制可以有效提升网络模型的效率.将多个TFIDB进行级联,并辅以IFU模块构成的轻量级网络可以在模型尺寸和性能之间达到更好的平衡.

    超分辨率(SR)卷积神经网络(CNN)信息蒸馏宽激活通道关注(CA)

    具有纹理感知能力的超像素分割方法

    吴江刘春晓
    1006-1016页
    查看更多>>摘要:目的 超像素分割是计算机视觉领域常用的一项预处理技术,目标是将相邻像素聚集成为具有一定语义的子区域,能够大幅度降低后续处理的计算复杂度,但是对包含强梯度纹理的图像分割效果不佳,为此提出一种具有纹理感知能力的超像素分割方法.方法 提出一种能够区分强梯度噪声和纹理像素的颜色距离,其中利用带方向的1/4圆形窗口均值滤波后的颜色信息,提升包含强梯度噪声和纹理图像的超像素分割性能.利用区间梯度幅值与Sobel梯度幅值相乘得到混合梯度幅值,具有纹理抑制、结构保持以及边缘线条细的优点,能够提升超像素的贴合边缘性能,增强超像素形状规则程度.最后,利用混合梯度的幅值计算具有结构回避能力的综合聚类距离,进一步防止超像素跨越物体的边界,增强超像素的贴边性能.结果 在BSDS500(Berkeley segmentation dataset 500)图像数据集和强纹理马赛克图像等不同类型图像上的测试结果显示,与目前主流的超像素分割方法相比,本文算法在UE(undersegmentation error)、ASA(achievable segmentation accuracy)和 CM(compactness measure)等性能指标上分别提高了 1.5%、0.2%和4.3%.从视觉效果上看,能够在排除纹理干扰的情况下生成结构边缘贴合程度更好的形状规则超像素.结论 本文算法在包含强梯度纹理图像上的超像素分割性能优于对比方法,在目标识别、目标追踪和显著性检测等易受强梯度干扰的技术领域具有较大应用潜力.

    图像分割超像素聚类强梯度纹理图像块线性路径

    深度聚类注意力机制下的显著对象检测

    陈庆文谢宏文查浩奚瑜...
    1017-1029页
    查看更多>>摘要:目的 为了得到精确的显著对象分割结果,基于深度学习的方法大多引入注意力机制进行特征加权,以抑制噪声和冗余信息,但是对注意力机制的建模过程粗糙,并将所有特征均等处理,无法显式学习不同通道以及不同空间区域的全局重要性.为此,本文提出一种基于深度聚类注意力机制(deep cluster attention,DCA)的显著对象检测算法DCANet(DCA network),以更好地建模特征级别的像素上下文关联.方法 DCA显式地将特征图分别在通道和空间上进行区域划分,即将特征聚类分为前景敏感区和背景敏感区.然后在类内执行一般性的逐像素注意力加权,并在类间进一步执行语义级注意力加权.DCA的思想清晰易懂,参数量少,可以便捷地部署到任意显著性检测网络中.结果 在6个数据集上与19种方法的对比实验验证了 DCA对得到精细显著对象分割掩码的有效性.在各项评价指标上,部署DCA之后的模型效果都得到了提升.在ECSSD(extended complex scene saliency dataset)数据集上,DCANet 的性能比第2名在 F 值上提升了 0.9%;在 DUT-OMRON(Dalian University of Technology and OM-RON Corporation)数据集中,DCANet的性能比第2名在F值上提升了 0.5%,平均绝对误差(mean absolute error,MAE)降低了 3.2%;在HKU-IS数据集上,DCANet的性能比第2名在F值上提升了 0.3%,MAE降低了 2.8%;在PASCAL(pattern analysis,statistical modeling and computational learning)-S(subset)数据集上,DCANet 的性能则比第2名在F值上提升了 0.8%,MAE降低了 4.2%.结论 本文提出的深度聚类注意力机制通过细粒度的通道划分和空间区域划分,有效地增强了前景敏感类的全局显著得分.与现有的注意力机制相比,DCA思想清晰、效果明显、部署简单,同时也为一般性的注意力机制研究提供了新的可行的研究方向.

    显著性检测注意力机制深度聚类空间—通道维度解耦全卷积网络(FCN)

    特征增强策略驱动的车标识别

    贺敏雪余烨
    1030-1040页
    查看更多>>摘要:目的 小样本情况下的车标识别在实际智能交通系统中具有十分重要的应用价值.针对从实际监控系统中获取的车标图像低分辨率、低质量的特点,考虑如何从车标结构相似性、局部显著特征方面来对车标的整体特征进行增强,提出一种特征增强策略驱动下的车标识别方法(vehicle logo recognition method based on feature enhance-ment,FE-VLR).方法 提取车标图像的自对称相似特征,构建图像金字塔,在每层金字塔下提取车标的整体特征和局部显著特征,其中局部显著区域通过基于邻域块相关度的显著区域检测来获取,最后结合CRC(collaborative representation based classification)分类器对车标进行分类识别.结果 在公开车标数据集HFUT-VL(Vehicle Logo Dataset from Hefei University of Technology)和 XMU(Xiamen University Vehicle Logo Dataset)上对算法效果进行评估,实验结果表明,在小样本情况下,本文方法优于其他一些传统的车标识别方法,且与一些基于深度学习模型的方法相比,其识别率也有所提升.在HFUT-VL数据集上,当训练样本数为5时,识别率达到97.78%;当训练样本数为20时,识别率为99.1%.在更为复杂的XMU数据集上,本文方法表现出了更好的有效性和更强的鲁棒性,当训练样本在15幅及以下时,本文方法与具有较好表现的OE-POEM(overlapping enhanced patterns of oriented edge magni-tudes)算法相比至少提升了 7.2%.结论 本文提出的基于特征增强策略的车标识别方法,通过融合自对称相似特征、局部显著特征和车标整体特征来增强特征的表达,提高了对实际道路中的低质量、低分辨率车标图像的识别能力,更能满足实际应用中对车标识别的需求.

    车标识别(VLR)特征增强(FE)自对称相似特征局部显著特征邻域块相关度

    融合上下文和注意力的视盘视杯分割

    刘洪普赵一浩侯向丹郭鸿湧...
    1041-1057页
    查看更多>>摘要:目的 青光眼会对人的视力造成不可逆的损伤,从眼底图像中精确地分割视盘和视杯是青光眼诊治中的一项重要工作,为有效提升视盘和视杯的分割精度,本文提出了融合上下文和注意力的视盘视杯分割方法(context attention U-Net,CA-Net).方法 进行极坐标转换,在极坐标系下进行分割可以平衡数据分布.使用修改的预训练ResNet作为特征提取网络,增强特征提取能力.采用上下文聚合模块(context aggregation module,CAM)多层次聚合图像上下文信息,使用注意力指导模块(attention guidance module,AGM)对融合后的特征图进行特征重标定,增强有用特征;使用深度监督思想同时对浅层网络权重进行训练,同时在视杯分割网络中引入了先验知识,约束对视杯的分割.结果 在3个数据集上与其他方法进行对比实验,在Drishti-GS1数据集中,分割视盘的Dice(dice coeffi-cient)和 IOU(intersection-over-union)分别为0.981 4和0.963 5,分割视杯的 Dice 和 IOU 分别为0.926 6和0.863 3;在 RIM-ONE(retinal image database for optic nerve evaluation)-v3数据集中,分割视盘的 Dice 和 IOU 分别为0.976 8和0.954 6,分割视杯的Dice和IOU分别为0.864 2和0.760 9;在Refuge数据集中,分割视盘的Dice和IOU分别为0.975 8和0.952 7,分割视杯的Dice和IOU分别为0.887 1和0.797 2,均优于对比算法.同时,消融实验验证了各模块的有效性,跨数据集实验进一步表明了 CA-Net的泛化性,可视化图像也表明CA-Net能够分割出更接近标注的分割结果.结论 在Drishti-GS1、RIM-ONE-v3和Refuge三个数据集的测试结果表明,CA-Net均能取得最优的视盘和视杯分割结果,跨数据集测试结果也更加表明了 CA-Net具有良好的泛化性能.

    青光眼视盘视杯上下文聚合模块注意力指导模块深度监督先验知识

    复杂背景下SAR近岸舰船检测

    阮晨郭浩安居白
    1058-1066页
    查看更多>>摘要:目的 船舶在合成孔径雷达(synthetic aperture radar,SAR)图像中的检测是研究热点,但目前适合近岸舰船检测的方法并不多.在SAR图像中,近岸舰船受到岸上建筑物的干扰严重,尤其是对于排列紧密的近岸船舶来说,其对比度相似,很难区分船舶与背景.为解决近岸舰船检测困难问题,提出了一种基于加权双向注意金字塔网络的近岸舰船检测方法.方法 本文在FCOS(fully convolutional one-stage)网络的基础上提出了一种新的双向特征金字塔网络.将卷积注意力机制模块(convolutional block attention module,CBAM)与金字塔网络的每个特征图进行连接,提取丰富的语义信息特征;借鉴PANet(path aggregation network)的思想,添加自下而上的金字塔模块,突出不同尺度船舶的显著特征.最后提出了一种加权特征融合方式,使特征图提取的特征信息的着重点不同,提高舰船检测精度.结果 本文在公开的SAR图像舰船数据集SSDD(SAR ship detection dataset)上进行实验.实验结果表明,相比原FCOS方法,本文方法的检测精度提高了 9.5%;与对比方法相比,本文方法在同等条件下的检测精度达到90.2%.在速度方面,本文方法比 SSD 提高0.6 s,比 Faster R-CNN(region convolutional neural network)提高1.67 s,明显优于对比方法.结论 本文通过改进特征网络和特征融合方式,提高了算法对SAR图像舰船目标检测中背景复杂、排列紧密的近岸舰船目标的定位效果,有效增强了对舰船目标定位的准确性.

    近岸舰船合成孔径雷达图像目标检测复杂背景深度学习小目标

    对抗型长短期记忆网络的雷达回波外推算法

    方巍庞林张飞鸿盛胜利...
    1067-1080页
    查看更多>>摘要:目的 雷达回波外推是进行短临降水预测的一种重要方法,相较于传统的数值天气预报方法能够实现更快、更准确的预测.基于卷积长短期记忆网络(convolutional long short-term memory network,ConvLSTM)的回波外推算法的效果优于其他的深度学习外推算法,但是忽略了普通卷积运算在面对局部变化特征时的局限性,并且在外推过程中将损失函数简单定义为均方误差(mean squared error,MSE),忽略了外推图像与原始图像的分布相似性,容易导致信息丢失.为解决以上不足,提出了一种基于对抗型光流长短期记忆网络(deep convolutional generative adversarial flow based long short-term memory network,DCF-LSTM)的回波外推算法.方法 首先,采用光流追踪局部特征的方式改进ConvLSTM,突破了一般卷积核面对局部变化特征的限制.然后,以光流长短期记忆网络(flow based long short-term memory network,FLSTM)作为基本模块构建外推模型.最后,引入对抗网络,与外推模型组成端到端的博弈系统DCF-LSTM,两者交替训练实现外推图像分布向原图像分布的拟合.结果 在4种不同的反射率强度下进行了消融研究,并与3种主流的气象业务算法进行了对比.实验结果表明,DCF-LSTM在所有评价指标中表现最优,尤其在反射率为35 dBZ的条件下.结论 由实验结果可知,引入光流法能够使模型具有更好的抗畸变性,引入深度卷积生成对抗网络(deep convolutional generative adversarial network,DCGAN)判别模块能进一步增加结果的准确性.本文提出的DCF-LSTM回波外推算法相比于其他算法,雷达外推准确率获得了进一步提升.

    雷达回波外推卷积长短期记忆网络(ConvLSTM)深度卷积生成对抗网络(DCGAN)光流法序列到序列结构