首页期刊导航|中国图象图形学报
期刊信息/Journal information
中国图象图形学报
中国图象图形学报

李小文

月刊

1006-8961

jig@irsa.ac.cn

010-64807995 8261442

100101

北京9718信箱

中国图象图形学报/Journal Journal of Image and GraphicsCSCD北大核心CSTPCD
查看更多>>本刊是集计算机图象图形高科技理论与应用研究成果、成果产品化与商情动态于一体的综合性学术期刊。是核心期刊、权威性杂志。作为中国图象图形学学会的会刊,利用学会在国内外广泛的科技信息渠道、全方位多层面的学科交叉应用,积极向产业界宣传科技成果,热心向科技界推荐最新产品。
正式出版
收录年代

    《中国图象图形学报》混合现实专栏简介

    章国锋刘越秦学英徐昆...
    2837-2838页

    基于单目视觉惯性的同步定位与地图构建方法综述

    章国锋黄赣谢卫健陈丹鹏...
    2839-2858页
    查看更多>>摘要:单目视觉惯性同步定位与地图构建(visual-inertial simultaneous localization and mapping,VI-SLAM)技术因具有硬件成本低、无需对外部环境进行布置等优点,得到了广泛关注,在过去的十多年里取得了长足的进步,涌现出诸多优秀的方法和系统。由于实际场景的复杂性,不同方法难免有各自的局限性。虽然已经有一些工作对VI-SLAM方法进行了综述和评测,但大多只针对经典的VI-SLAM方法,已不能充分反映最新的VI-SLAM技术发展现状。本文首先对基于单目VI-SLAM方法的基本原理进行阐述,然后对单目VI-SLAM方法进行分类分析。为了综合全面地对比不同方法之间的优劣势,本文特别选取3个公开数据集对代表性的单目VI-SLAM方法从多个维度上进行定量评测,全面系统地分析了各类方法在实际场景尤其是增强现实应用场景中的性能。实验结果表明,基于优化或滤波和优化相结合的方法一般在跟踪精度和鲁棒性上比基于滤波的方法有优势,直接法/半直接法在全局快门拍摄的情况下精度较高,但容易受卷帘快门和光照变化的影响,尤其是大场景下误差累积较快;结合深度学习可以提高极端情况下的鲁棒性。最后,针对深度学习与V-SLAM/VI-SLAM结合、多传感器融合以及端云协同这3个研究热点,对SLAM的发展趋势进行讨论和展望。

    视觉惯性同步定位与地图构建(VI-SLAM)增强现实(AR)视觉惯性数据集多视图几何多传感器融合

    面向增强现实的虚实遮挡技术综述

    吴宇晖李晓娟刘越
    2859-2879页
    查看更多>>摘要:随着软件技术的快速发展以及硬件设备的不断更新,增强现实技术已逐步成熟并广泛应用于各个领域。在增强现实中,虚实遮挡处理是实现虚拟世界和真实世界无缝融合的前提,对提升用户的沉浸感和真实感具有重要的研究意义。该技术通过建立尽可能精确的虚实物体遮挡关系以呈现逼真的虚实融合效果,使得用户能够正确地感知虚拟物体和真实物体的空间位置关系,从而提升交互体验。本文首先介绍了虚实遮挡的相关背景、概念和总体处理流程。然后针对刚性物体和非刚性物体的不同特点,总结了现有的基于深度、基于图像分析和基于模型3类虚实遮挡处理方法的具体原理、代表性研究工作以及它们对刚性物体和非刚性物体的适用性。在此基础上,从实时性、自动化程度、是否支持动态场景及适用范围等多个角度对现有的虚实遮挡方法进行了对比分析,并归纳了 3类虚实遮挡处理方法的具体流程、难点以及局限性。最后针对相关工作中存在的问题,提出了目前虚实遮挡技术所面临的挑战以及未来可能的研究方向,希望能为后续的研究工作提供参考。

    增强现实虚实遮挡刚体及非刚体深度图修复前景提取

    轻量化视觉定位技术综述

    叶翰樵刘养东申抒含
    2880-2911页
    查看更多>>摘要:视觉定位旨在从已知的三维场景中恢复当前观测图像的相机位姿。视觉定位技术具备低成本、高精度和易于集成等优势,是实现计算设备与真实世界建立智能交互过程的关键技术之一,如今获得了混合现实、自动驾驶等应用领域的广泛关注。作为计算机视觉领域长期探索的基础任务之一,视觉定位方法至今已取得显著的研究进展,然而现有方法普遍存在计算开销和存储占用过大等不足,这些问题导致视觉定位在移动端的高效部署和场景模型的更新维护方面存在困难,并因此在很大程度上限制着视觉定位技术的实际应用。针对这一问题,部分研究工作开始聚焦于推动视觉定位技术的轻量化发展。轻量化视觉定位旨在研究更加高效的场景表达形式及其视觉定位方法,目前正逐渐成为视觉定位领域重要的研究方向。本文首先回顾早期视觉定位框架,随后从场景表达形式的角度对具备轻量化特性的现有视觉定位研究工作进行分类。在各个方法类别下,分析总结其特点优势、应用场景和技术难点,并同时介绍代表性成果。进一步地,本文对部分轻量化视觉定位的代表性方法在常用室内外数据集上的性能表现进行对比分析,评估指标主要包含离线建图的用时、场景地图的存储占用和定位精度3个维度。现有的轻量化视觉定位技术仍然面临着诸多的难题与挑战,场景模型的表达能力、定位方法的泛化性与鲁棒性尚存在较大的提升空间。最后,本文对轻量化视觉定位未来的发展趋势进行分析与展望。

    视觉定位相机位姿估计三维场景表达轻量化地图特征匹配场景坐标回归位姿回归

    基于物理的可微渲染综述

    邢健开徐昆
    2912-2925页
    查看更多>>摘要:可微渲染技术是当前计算机图形学与计算机视觉方向的研究热点,其目标是将计算机图形学中的渲染流水线进行可微化改造以支持计算渲染的输出图像关于输入参数如几何、材质等参数的梯度。结合渲染图像与目标图像之间的损失函数,可微渲染允许在生成式分析的框架中,通过梯度下降的方式从图像中推理出场景参数,是解决三维重建、逆向渲染等领域问题的有效方法,并在虚拟现实、自动驾驶等领域有着广泛的应用前景。基于物理的可微渲染旨在对基于物理的渲染管线进行可微化改造,主要涉及对场景几何和材质的表达,以及光路传输模拟过程的梯度计算方法。本文对近年来基于物理的可微渲染领域的发展情况进行了调研,总结了基于物理的可微渲染研究进展。首先总体介绍正向渲染和可微渲染的计算方法;然后介绍如何针对具体的几何、材质以及相机的表达方式进行梯度计算;讨论如何提高可微渲染的效率和鲁棒性;展示可微渲染如何应用于实际任务中;最后本文展望了可微渲染的发展趋势,期望推动该领域的进一步发展。

    渲染可微渲染逆向渲染光线跟踪三维重建

    情感挑战研究进展及其在元宇宙中的应用前景

    彭晓兰黄进田丰
    2926-2936页
    查看更多>>摘要:随着虚拟现实、元宇宙以及生成式人工智能等自然人机交互技术的发展,以交互式虚拟内容为主的人机界面正在给用户提供一种新型的任务挑战——情感挑战。情感挑战主要考察人对虚拟世界情感的理解、探索和处理能力,是元宇宙虚拟交互场景承载的核心内容,也是未来数字世界不可或缺的重要元素。情感挑战自2015年提出以来,一直受到人机交互领域高度关注。在此背景下,国内外研究者们围绕情感挑战的定义和特性、交互设计、评估量表和计算建模等方面开展了一系列研究工作,本文主要对这些工作进行系统化整理和介绍,并对情感挑战在元宇宙中的应用前景进行展望。首先,本文从传统数字游戏中的物理挑战和认知挑战出发,介绍情感挑战的发现、提出、完善和应用;其次,本文对虚拟现实中的情感挑战交互效应研究和情感挑战计算建模方法进行了介绍;然后,本文基于已有工作,从人机交互的角度给出了情感挑战的定义,介绍了情感挑战存在的主要媒介和设计方法;最后,本文总结了情感挑战在元宇宙中的研究意义,并对情感挑战在元宇宙中的应用前景进行了展望。

    情感挑战叙事性游戏虚拟现实(VR)元宇宙人机交互

    混合现实中的上下文信息构建与应用进展综述

    杨浩中舒文桐汪淼
    2937-2954页
    查看更多>>摘要:随着信息技术的发展,混合现实(mixed reality,MR)技术已应用于医疗、教育和辅助引导等众多领域。MR场景包含丰富的语义信息,基于场景上下文信息的混合现实技术可以改善用户对场景的感知,优化用户的交互操作、提升交互模型的准确度,受到广泛关注。然而,目前在该领域没有针对上下文信息进行调查的综述类文献,缺乏梳理与分类。本文的研究对象是使用上下文信息的MR技术与系统。通过对MR领域的文献调研,本文提出了 3个研究问题,并对国外近20年的33篇实证研究论文进行分析,概述了使用上下文信息的MR技术的最新发展,从3个维度出发进行分类学研究并分别提出分类标准,如上下文信息种类、上下文知识库的构建方式和应用领域等。其中,上下文信息的种类可以分为场景语义、对象语义、空间关系、群组关系、从属关系和运动信息6类,知识库的构建按用户介入角度和基础技术类型划分,应用领域从场景类型和生成式特性出发进行分类。通过对不同维度对研究对象的分类,本文对提出的研究问题进行了回应,并总结了现阶段的不足以及未来可能的研究方向。本综述可以辅助不同领域的研究人员对上下文信息的设计、选择和评估,从而推动未来混合现实应用技术与系统的研发。

    虚拟现实(VR)增强现实(AR)感知与交互上下文信息场景语义

    三维场景注视点渲染深度学习方法综述

    李英群胡啸徐翔徐延宁...
    2955-2978页
    查看更多>>摘要:在大型高分辨显示器和头戴式显式设备中实现实时、逼真的渲染仍然是计算机图形学面临的主要挑战之一。注视点渲染(foveated rendering)利用人类视觉系统的局限性,根据注视点调整图像渲染质量,从而在不损失用户感知质量的前提下大大提高渲染速度。随着深度学习方法在渲染领域的广泛应用,涌现出大量基于深度学习的注视点渲染新方法。本文从深度学习的角度对注视点渲染领域的最新方法进行综述。首先,概述了人类视觉感知的背景知识。接着,简要介绍了注视点渲染中最具代表性的非深度学习方法,包括自适应分辨率、几何简化、着色简化和硬件实现,并总结了这些方法的优缺点。随后,描述了文中用于评估深度学习不同方法所使用的评估准则,包括常用的注视点渲染图像的评估指标和注视点预测评估指标。接下来,将注视点渲染中的深度学习方法细分为超分辨率、降噪、补全、图像合成、注视点预测和图像应用,对它们进行详细概述和总结。最后,提出了深度学习方法目前面临的问题和挑战。通过对注视点渲染领域的深度学习方法的讨论,可以更详细地展示深度学习在注视点渲染中的研究前景和发展方向,对后续研究人员在选择研究方向和设计网络架构等方面都有一定的参考价值。

    注视点渲染深度学习实时渲染注视点预测图像补全超分辨率光路追踪降噪

    基于邻域信息和注意力的无参考点云质量评估

    陈晓雷张育儒胡森涌杜泽龙...
    2979-2991页
    查看更多>>摘要:目的 针对现有无参考点云质量评估方法需要将点云预处理为二维投影或其他形式导致引入额外噪声、限制空间上下文等问题,提出了一种基于邻域信息嵌入变换模块和点云级联注意力模块的无参考点云质量评估方法。方法 将点云样本整体作为输入,减轻预处理引入的失真。使用稀疏卷积搭建U型主干网络提取多尺度特征,邻域信息嵌入变换模块逐点学习提取特征,点云级联注意力模块增强小尺度特征,提高特征信息的可辨识性,最后逐步聚合多尺度特征信息形成特征向量,经全局自适应池化和回归函数进行回归预测,得到失真点云质量分数。结果 实验在2个数据集上与现有的12种代表性点云质量评估方法进行了比较,在SJTU-PCQA(Shanghai Jiao Tong University subjective point cloud quality assessment)数据集中,相比于性能第 2 的模型,PLCC(Pearson linear correlation coefficient)值提高了 8。7%,SROCC(Spearman rank-order coefficient correlation)值提高了 0。39%;在 WPC(waterloo point cloud)数据集中,相比于性能第2的模型,PLCC值提高了 4。9%,SROCC值提高了 3。0%。结论 所提出的基于邻域信息嵌入变换和级联注意力的无参考点云质量评估方法,提高了可辨识特征提取能力,使点云质量评估结果更加准确。

    三维质量评估点云无参考邻域信息级联注意力

    增量式尺度估计下的相机位置解算

    李梦晗高翔解则晓申抒含...
    2992-3007页
    查看更多>>摘要:目的 全局式从运动恢复结构(structure from motion,SfM)通过运动平均一次性恢复所有相机的绝对位姿,效率相对较高。运动平均中的平移平均主要负责解算相机在世界坐标系下的绝对位置,其求解过程因尺度歧义性、估计敏感性和求解不确定性的影响而较为困难。本文提出了一种基于增量尺度估计的平移平均方法,在消除尺度歧义性的同时提升了求解鲁棒性与准确性。方法 本文将平移平均问题解耦为3个子问题:1)局部绝对尺度的增量式估计;2)全局绝对尺度的增量式估计;3)基于L1优化的尺度已知的绝对位置估计。结果 在1DSfM数据集上进行对比实验,基线解算精度明显提升,解算相机百分比的均值达到96%。当引入两种不同的绝对旋转进行计算时,其绝对位置中值误差仅略差于 BATA(bilinear angle-based translation averaging)与 CReTA(correspondence reweighted translation averaging),排名第3,均值误差改善更为明显,分别排名第1和第2。相较于原始方法,本文方法在相机解算数量与位置解算精度上均有较大提升。结论 本文方法综合了尺度分离思想与增量式参数估计思想,既消除了尺度歧义性,又保证了鲁棒性与高效性,求解所得的相机绝对位置稳定可靠。

    全局式从运动恢复结构平移平均尺度分离基线长度求解增量式参数估计