首页期刊导航|中国图象图形学报
期刊信息/Journal information
中国图象图形学报
中国图象图形学报

李小文

月刊

1006-8961

jig@irsa.ac.cn

010-64807995 8261442

100101

北京9718信箱

中国图象图形学报/Journal Journal of Image and GraphicsCSCD北大核心CSTPCD
查看更多>>本刊是集计算机图象图形高科技理论与应用研究成果、成果产品化与商情动态于一体的综合性学术期刊。是核心期刊、权威性杂志。作为中国图象图形学学会的会刊,利用学会在国内外广泛的科技信息渠道、全方位多层面的学科交叉应用,积极向产业界宣传科技成果,热心向科技界推荐最新产品。
正式出版
收录年代

    《中国图象图形学报》无人系统的平行决策智能专栏简介

    舒振杰王飞跃鲍泓陈龙...
    3171-3172页

    仿真到现实环境的自动驾驶决策技术综述

    胡学敏黄婷玉余雅澜任佳佳...
    3173-3194页
    查看更多>>摘要:自动驾驶汽车作为未来交通的重要发展方向,决策技术是其进行安全高效行驶的关键。基于成本和安全性的考虑,最新的自动驾驶决策技术往往先在仿真环境中研究,再在现实世界中应用,故在自动驾驶决策领域,仿真到现实的方法能帮助自动驾驶系统更有效地进行学习、训练和验证。然而,仿真环境和现实环境之间的差距会在这些模型和技术转移到真实车辆时带来挑战,这种仿真到现实环境域差距的问题促使研究人员探索解决该问题的途径,并且提出各种有效的方法。本文将这些方法总结为两大类:虚实迁移和平行智能。前者通过不同方法将在模拟环境中训练的车辆决策迁移到现实环境中,以解决域差距问题;后者通过构建虚拟的人工系统和现实的物理系统,将二者进行交互、比较、学习和实验,从而解决自动驾驶决策在现实环境中的适配问题。本文首先从虚实迁移和平行智能的原理,以及自动驾驶决策领域应用的角度进行了详细综述,这也是首次从平行智能的角度来思考自动驾驶决策技术中仿真到现实环境的问题,然后总结了搭建仿真环境常用的自动驾驶模拟器,最后归纳了仿真到现实环境的自动驾驶面临的挑战和未来的发展趋势,既为自动驾驶在现实场景的应用与推广提供技术方案,也为自动驾驶研究人员提供新的想法和方向。

    自动驾驶决策技术域差距(RG)虚实迁移(sim2real)平行智能(PI)

    无人智能集群系统决策与控制研究进展

    潘振华夏元清鲍泓王睿哲...
    3195-3215页
    查看更多>>摘要:无人集群系统是当前人工智能和机器人领域备受关注的研究热点,已在多个领域展现出广阔的应用前景。对无人集群系统进行了深入综述和分析,着重探讨了协同决策和博弈控制两个关键方面,旨在通过智能体之间的信息共享和协作,提高系统效率,解决在智能体之间可能出现的利益冲突和决策问题。首先,对一些基本概念进行了明确阐述,包括智能体、集群智能和无人集群系统,有助于读者建立对这一领域的基本理解。随后,介绍了协同与博弈控制数学模型、集群协同与博弈决策、集群协同控制方法、集群博弈控制方法等算法,着重强调了协同决策和博弈控制的理论基础,以及它们如何应用于无人集群系统中,从而提高系统的整体性能。接下来,列举了集群协同与博弈在多个领域的一些典型应用案例,包括智能交通、无人机编队、物流配送和军事领域。这些实际案例展示了该技术的广泛应用领域,以及它对提高效率和解决复杂问题的潜力。最后,讨论了未来研究方向和挑战,包括对新技术和方法的需求,以应对不断发展的需求和问题,以及如何进一步推动无人集群系统的发展。本文为无人集群系统的进一步发展提供指导和参考,以推动该领域的发展和创新,为未来的科学和技术进步做出了一定贡献。

    无人集群系统(USS)智能决策博弈控制协同控制强化学习(RL)

    端到端自动驾驶系统研究综述

    陈妍妍田大新林椿眄殷鸿博...
    3216-3237页
    查看更多>>摘要:近年深度学习技术助力端到端自动驾驶框架的发展和进步,涌现出一系列创新研究议题与应用部署方案。本文首先以经典的模块化系统切入,对自动驾驶感知—预测—规划—决策4大功能模块进行简要概述,分析传统的模块化和多任务方法的局限性;其次从输入—输出模态到系统架构角度对当前新兴的端到端自动驾驶框架进行广泛地调研,详细描述弱解释性端到端与模块化联合端到端两大主流范式,深入探究现有研究工作存在的不足和弊端;之后简单介绍了端到端自动驾驶系统的开环—闭环评估方法及适用场景;最后总结了端到端自动驾驶系统的研究工作,并从数据挖掘和架构设计角度展望领域潜在挑战和亟待解决的关键问题。

    人工智能(AI)自动驾驶模块式系统端到端系统数据驱动可解释性

    自动驾驶中的三维目标检测算法研究综述

    李昌财陈刚侯作勋黄凯...
    3238-3264页
    查看更多>>摘要:新兴的三维目标检测技术在自动驾驶领域中扮演着关键的角色,它通过提供环境感知和障碍物检测等信息,为自动驾驶系统的决策和控制提供了基础。过去的许多学者对该领域优秀的方法论和成果进行了全面的检验和研究。然而,由于技术上的不断更新和快速进步,对该领域的最新进展保持持续跟踪并坚持跟随知识前沿,不仅是学术界的一项至关重要任务,同时也是应对新兴挑战的一项基础。本文回顾了近两年内的新兴成果并针对该方向中的前沿理论进行系统性的阐述。首先,简单介绍三维目标检测的背景知识并回顾相关的综述研究。然后,从数据规模、多样性等方面对 KITTI(Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago)等多个流行的数据集进行了归纳总结,并进一步介绍相关基准的评测原理。接下来,按照传感器类型和数量将最近的几十种检测方法划分为基于单目的、基于立体的、基于多视图的、基于激光雷达的、基于多模态5个类别,并根据模型架构或数据预处理方式的不同对每一种类别进行更深层次的细分。在每一种类别的方法中,首先对其代表性算法进行简单回顾,然后着重对该类别中最前沿的方法进行综述介绍,并进一步深入分析了该类别潜在的发展前景和当前面临的严峻挑战。最后展望了三维目标检测领域未来的研究方向。

    自动驾驶三维目标检测单目立体多视图激光雷达多模态

    无人驾驶突发紧要场景下基于平行视觉的风险增强感知方法

    苟超刘欣欣郭子鹏周昱臣...
    3265-3279页
    查看更多>>摘要:目的 随着视觉感知技术的快速发展,无人驾驶已经可以应用于简单场景。但是在实际的复杂城市道路应用中,仍然存在一些挑战,尤其是在其他车辆的突然变道、行人的闯入、障碍物的出现等突发紧要场景中。然而,真实世界中此类紧要场景数据存在长尾分布问题,导致数据驱动为主的无人驾驶风险感知面临技术瓶颈,因此,本文提出一种基于平行视觉的风险增强感知方法。方法 该方法基于交互式ACP(artificial societies,computational experiments,parallel execution)理论,在平行视觉框架下整合描述、指示、预测智能,实现基于视觉的风险增强感知。具体地,基于描述与指示学习,在人工图像系统中引入改进扩散模型,设计背景自适应模块以及特征融合编码器,通过控制生成行人等危险要素的具体位置,实现突发紧要场景风险序列的可控生成;其次,采用基于空间规则的方法,提取交通实体之间的空间关系和交互关系,实现认知场景图的构建;最后,在预测学习框架下,提出了一种新的基于图模型的风险增强感知方法,融合关系图注意力网络和Transformer编码器模块对场景图序列数据进行时空建模,最终实现风险的感知与预测。结果 为验证提出方法的有效性,在MRSG-144(mixed reality scene graph)、IESG(interaction-enhanced scene graph)和 1043-carla-sg(1043-carla-scenegraph)数据集上与 5 种主流风险感知方法进行了对比实验。提出的方法在3个数据集上分别取得了 0。956、0。944、0。916的Fl-score,均超越了现有主流方法,达到最优结果。结论 本文是平行视觉在无人驾驶风险感知领域的实际应用,对于提高无人驾驶的复杂交通场景风险感知能力,保障无人驾驶系统的安全性具有重要意义。

    无人驾驶平行视觉认知场景图扩散生成风险感知

    考虑定位不确定性的无人驾驶安全规划方法

    单云霄刘沅昊
    3280-3292页
    查看更多>>摘要:目的 无人驾驶规划与控制是保障行驶安全的重要环节之一,现有的规划方法大多假定驾驶场景是精确感知的,忽略了行驶环境中存在的感知、定位等不确定性。忽略这些不确定性的因素将影响驾驶的安全。本文在考虑传感器数据不确定性的情况下,将系统中实际存在的定位不确定性融入规划系统,从而规划出更加安全的轨迹。方法 通过研究基于栅格地图的不确定环境概率模型框架以及基于该表征框架的轨迹规划方法降低不确定性的影响,产生舒适安全的类人轨迹。该方法首先将先验地图转换为栅格地图作为全局栅格地图,接着结合定位系统将局部栅格地图初始化,然后在局部栅格地图中进行定位不确定性传播,最后在Frenet坐标系进行轨迹规划,使用局部栅格地图的占据概率计算候选轨迹代价,选择最优代价轨迹。结果 本文方法在CARLA(CAR learning to act)仿真器中进行验证,通过仿真实验对比多种方法,验证了本文方法能够在定位不确定性环境下平稳行驶,安全地避开障碍物,在路径安全性和高效性上找到一个平衡点,在多种场景下本文考虑定位不确定性的方法通过率提高15%。结论 本文提出了一种能够融入多种不确定性的环境表征框架,并将定位系统不确定性融入规划方法,实现了规划的安全性和效率的提升。

    不确定性无人驾驶栅格地图轨迹规划Frenet规划传感器误差

    面向网联自动驾驶部署的车—路—无人机跨域协同技术

    于静茹姚升悦陈喜群林懿伦...
    3293-3304页
    查看更多>>摘要:目的 随着车联网技术的发展,网联自动驾驶车辆(connected and autonomous vehicle,CAV)的部署场景变得越来越复杂。为了保证效率和安全,提出一种面向CAV部署的集成无人机和现有路侧基础设施的车—路—无人机跨域协同技术,旨在解决依靠路侧基础设施支持CAV感知和通信解决方案在部署范围、机动性和感知视角等方面存在一定限制的问题。方法 本文设计了基于任务需求和资源约束的双层调度算法,实现无人机资源的灵活调度和智能决策。该算法上层实现任务规划,下层运动规划则根据动力学约束和虚拟场模型生成无人机运动轨迹,采用上、下层反馈机制,动态响应感知和通信需求,给出目标区域无人机的最优部署方案。结果 实验模拟混合交通流场景,并估计了不同场景下CAV动态感知和通信需求;通过对比无人机跨域协同方案与现有路侧基础设施辅助方案,结果表明所提方案相比现有方案降低了路侧设备单元(roadside units,RSU)的空闲率,在CAV渗透率为70%时,所提方案在仿真路网和城市路网场景下分别将RSU的空闲率降低了 33。82%和31。20%;同时也展示了基于双层调度算法按需调度无人机的流程,验证了该算法的有效性。结论 本文所提出的无人机跨域协同的CAV辅助部署方案,对比现有的基础设施辅助方案,具有覆盖范围广、可以按需灵活调度的特点,可以支持CAV大规模部署。

    自动驾驶跨域协同无人机按需调度双层调度算法基于虚拟力场的轨迹规划

    面向驾驶场景精准图像翻译的条件扩散模型

    徐映芬胡学敏黄婷玉李燊...
    3305-3318页
    查看更多>>摘要:目的 针对虚拟到现实驾驶场景翻译中成对的数据样本匮乏、翻译结果不精准以及模型训练不稳定等问题,提出一种多模态数据融合的条件扩散模型。方法 首先,为解决目前主流的基于生成对抗网络的图像翻译方法中存在的模式崩塌、训练不稳定等问题,以生成多样性强、训练稳定性好的扩散模型为基础,构建图像翻译模型;其次,为解决传统扩散模型无法融入先验信息从而无法控制图像生成这一问题,提出基于多头自注意力机制的多模态特征融合方法,该方法能将多模态信息融入扩散模型的去噪过程,从而起到条件控制的作用;最后,基于语义分割图和深度图能分别表征物体的轮廓信息和深度信息这一特点,将其与噪声图像进行融合后输入去噪网络,以此构建多模态数据融合的条件扩散模型,从而实现更精准的驾驶场景图像翻译。结果 在Cityscapes数据集上训练本文提出的模型,并且将本文方法与先进方法进行比较,结果表明,本文方法可以实现轮廓细节更细致、距离远近更一致的驾驶场景图像翻译,在弗雷歇初始距离(Fréchet inception distance,FID)和学习感知图像块相似度(learned perceptual image patch similarity,LPIPS)等指标上均取得了更好的结果,分别为44。20和0。377。结论 本文方法能有效解决现有图像翻译方法中数据样本匮乏、翻译结果不精准以及模型训练不稳定等问题,提高驾驶场景的翻译精确度,为实现安全实用的自动驾驶提供理论支撑和数据基础。

    虚拟到现实图像翻译扩散模型多模态融合驾驶场景

    二维人体姿态编解码方法综述:从解决歧义性问题的角度出发

    喻莉杜聪炬闫增强赵慧娟...
    3319-3344页
    查看更多>>摘要:人体姿态估计在娱乐、健康、安全等领域为众多应用提供了关键技术支持。人体姿态编解码的目的在于从原始输入数据中提取特征,将其构建为更易处理和理解的中间表示形式,并从中恢复出可理解的人体姿态。然而,实际场景中受到光照、运动模糊、遮挡、复杂姿态、拍摄视角和图像分辨率等因素的影响,人体姿态估计常常受到分布歧义、尺度歧义和关联歧义等问题的困扰。因此,合理的编解码设计是解决人体姿态估计各类歧义性问题的关键。首先,对人体姿态建模方法进行介绍,其是实现人体姿态编解码的前提条件。然后,针对分布歧义问题,从基于分布约束、基于结构约束和基于迭代约束3个方面进行介绍;尺度歧义问题被划分为关键点尺度歧义和像素尺度歧义问题,并介绍与之相关的基于尺度表征、基于无偏变换和基于积分回归的方法;针对关联歧义问题,归纳包括基于图优化、基于肢体向量、基于实例中心和基于参考标签的4类人体姿态编解码方法。同时,对各方法的性能进行了总结分析。最后,对未来人体姿态编解码的研究方向进行了展望。

    深度学习人体姿态估计歧义性问题人体姿态编解码人体姿态建模