首页期刊导航|计算机辅助设计与图形学学报
期刊信息/Journal information
计算机辅助设计与图形学学报
计算机辅助设计与图形学学报

吴恩华

月刊

1003-9775

jcad@ict.ac.cn

010-62562491;62600342

100190

北京2704信箱

计算机辅助设计与图形学学报/Journal Journal of Computer-Aided Design & Computer GraphicsCSCD北大核心CSTPCDEI
查看更多>>本刊创刊于1989年,是我国CAD和计算机图形学领域第一个公开出版的学术刊物,原为季刊,1996年起改为双月刊,从2000年起改为月刊。 该刊以快速传播CAD与计算机图形学领域的知识与经验为目的,刊登有创新的学术论文,报导最新科研成果和学术动态,及时反映该领域发展水平与发展方向。 该刊面向全国,聘请了我国CAD和计算机图形学学术界的知名学者、专家参加刊物的编委会,具有权威性和代表性。 读者对象为从事CAD和计算机图形及其他有关学科的科研、工程技术人员及高等院校师生。 被《中文核心期刊要目总览》第三版定为我国计算技术、计算机类核心期刊;被中国科学技术信息研究所接受为中国科技论文统计与分析用刊;被中国科学引文数据库、《中国学术期刊文摘》、《电子科技文摘》收录。从1996年起,每期由清华大学国家光盘工程中心全文收录到《中国学术期刊(光盘版)》中。从1996年开始被美国的工程索引(EI)收录。从1999年起被英国SA,INSPEC(Computer & Control Abstracts)及俄罗斯文摘杂志收录。
正式出版
收录年代

    大规模场景运动恢复结构研究综述

    高翔李梦晗申抒含
    969-994页
    查看更多>>摘要:运动恢复结构旨在基于图像间的局部特征匹配解算相机在全局统一坐标系下的绝对位姿,是基于图像的三维重建中的关键问题。近年来,随着采集设备、计算资源以及理论方法的发展,运动恢复结构研究已逐渐由实验室小规模可控场景向室内外大规模实际场景扩展,并取得了成果显著的理论方法与实际应用。文中从实际应用出发,综述了面向大规模场景三维重建的运动恢复结构研究领域的最新成果;专注于运动恢复结构中相机位姿解算核心问题,并全面介绍了其中的最新成果按照解析式与学习式方法进行;在此基础上,为助力社区发展,讨论与分析的运动恢复结构当前研究进展与未来发展态势。

    运动恢复结构大规模场景三维重建解析式SfM方法学习式SfM方法

    神经辐射场的研究现状与展望

    李吉洋程乐超何靖璇王章野...
    995-1013页
    查看更多>>摘要:基于2D图片的视点合成一直是计算机视觉和计算机图形学领域中的一个关键问题,旨在通过一组目标场景的2D图片合成新视角下的场景图片。神经辐射场作为一种新颖的隐式场景表达方式,因其出色的视觉效果备受研究者的关注。对神经辐射场的发展历程进行梳理,从理论基础、优化与扩展以及应用等方面介绍了相关研究。在神经辐射场的优化与扩展方面,通过优化网络结构、模型压缩等方式加速训练及渲染过程,还有一些工作致力于降低对输入图片的要求以及提高渲染质量;在应用方面,神经辐射场在人、物及场景的建模中展现出巨大的潜力,并有工作将其扩展到动态场景的表达。此外,神经辐射场与生成式模型结合,可以实现通过文本或者图像来引导三维模型生成的目标。最后,总结了现有研究工作的不足,并指出加速神经辐射场的训练与渲染,优化渲染结果,以及进一步扩展应用场景仍然是未来相关工作的研究方向。

    神经辐射场深度学习神经渲染三维重建

    基于方向编码与空洞采样的室内点云物体分割

    李彭陈西江赵不钒宣伟...
    1014-1025页
    查看更多>>摘要:针对现有方法在处理局部特征时忽略方向信息,且由于卷积核大小的限制无法有效地提取点云邻域特征等问题,提出一种点云分割方法。首先结合方向编码和空洞采样最大程度扩大网络的局部感受野。其次利用图卷积神经网络挖掘局部邻域内点的信息。然后使用邻域特征提取层自动加权融合邻域特征为更具有代表性的单个特征点。最后结合空间注意力机制,增加远程点之间的联系。在S3DIS数据集上进行物体分割实验的结果表明,所提方法的OA和mloU比PointWeb高1。3个百分点和4。0个百分点,比基线方法RandLA-Net高0。6个百分点和0。7个百分点,使用空洞采样与方向编码能够有效地提高点云的语义分割精度。

    三维点云空洞采样物体分割注意力机制方向编码

    融合图像信息的跨模态Transformer点云补全算法

    何星朱哲燕雪峰郭延文...
    1026-1033页
    查看更多>>摘要:针对三维传感器(如LiDAR、深度相机)获取的点云往往残缺不全,需要进行补全处理,而单模态方法存在的补全结果细节不丰富、结构不完整等问题,提出一种融合图像信息的跨模态Transformer点云补全算法。首先采用点云分支和图像分支分别提取点云特征和图像特征,其中,点云分支采用PoinTr为骨干网络,图像分支采用7层卷积;然后通过特征融合模块融合点云特征和图像特征,由粗到精地生成全分辨率的点云。在ShapeNet-ViPC数据集上进行实验的结果表明,所提算法的可视化结果优于单模态点云补全方法和目前仅有的跨模态点云补全方法ViPC,且在大部分测试类别上的CD-L2量化指标优于ViPC;平均CD-L2为2。74,比ViPC低17%。为了便于研究人员评估和使用,文中算法可通过https://github。com/Starak-x/ImPoinTr开源获取。

    点云补全Transformer跨模态

    G1连续组合曲线曲面的构造

    严兰兰付雨楠揭梦柔刘喆...
    1034-1046页
    查看更多>>摘要:为了在保留B样条方法自动光滑性的基础上突破其要求各部分曲线曲面的次数必须相等的限制,同时赋予曲线曲面独立于控制顶点的形状可调性,提出一种G1连续组合曲线曲面的构造方法。首先构造一组含2个自由参数的n(n≥2)次基函数并分析其性质,基于该基函数,定义了结构与n次Bézier曲线曲面相同的新曲线曲面,其包含n次Bézier曲线曲面为特例;然后分析新曲线曲面的G1光滑拼接条件,根据拼接条件,采用与B样条方法相同的组合思想但是不同的组合方式,定义基于新曲线曲面的分段组合曲线与分片组合曲面,其包含2次均匀和2次准均匀B样条为特例。实例结果表明,定义方式自动保证了组合曲线曲面在连接处的G1连续性,组合曲线曲面的端点与角点位置以及内部形状都可以通过改变自由参数的取值来进行调整,且调整方式既可以是全局的又可以是局部的;所提方法为复杂曲线曲面的造型设计提供了便利。

    曲线曲面设计组合曲线曲面Bézier方法B样条方法几何连续性

    鲁棒的水密流形网格修复

    王鹏飞徐敏峰辛士庆严冬明...
    1047-1056页
    查看更多>>摘要:针对未经修复的网格模型一般存在非流形结构,常带有孔洞、法向不一致、自交等缺陷,很难直接应用到后续基于网格的应用中的问题,提出一种保持输入网格特征的鲁棒水密流形网格修复算法。首先利用Manifoldplus算法和卷绕数(winding number)构建能够区分输入网格内外且逼近输入网格的水密流形引导曲面;然后利用引导曲面计算受限Voronoi图(restricted Voronoi diagram,RVD);再通过对偶得到受限三角剖分(restricted Delaunay triangulation,RDT);将非流形问题分解到RVD和RDT计算过程中,保证计算的RDT即为修复后的水密流形网格;最后在原始网格边中添加辅助点,保持原始网格特征。基于Windows 10平台,在ModelNet10公开数据集上进行实验的结果表明,所提算法在输出网格的平均精度为1。54×10-6,与Manifoldplus算法相当;但是当输入的模型包含孔洞时,Manifoldplus算法无法将孔洞合理地填补,而该算法能够合理地填补孔洞。

    网格修复限制Voronoi水密流形

    基于点多边形的混合坐标

    苗苗李亚娟邓重阳
    1057-1064页
    查看更多>>摘要:为了构造非负且光滑的广义重心坐标,提出一种基于点多边形的混合坐标构建方法。首先将原多边形三角剖分,计算所有网格顶点的重心坐标,并确定每个网格顶点的点多边形;然后分别计算原多边形内点关于其所在三角形的点多边形的重心坐标与混合系数,根据以上计算结果得到混合坐标;最后使用迭代坐标或调和坐标计算网格顶点的重心坐标,用均值坐标和迭代坐标计算原多边形内点关于点多边形的重心坐标。数值实例采用多个多边形的等高线图,以及其不同重心坐标的非负区域、光滑性、纹理映射对比,表明所提方法具有良好的光滑性,且在任意多边形内部具有非负性。

    点多边形均值坐标迭代坐标调和坐标混合系数

    多模态特征融合和自蒸馏的红外-可见光行人重识别

    万磊李华锋张亚飞
    1065-1076页
    查看更多>>摘要:现有跨模态行人重识别方法大多挖掘模态不变的特征,忽略了不同模态内的具有判别性的自有特征。为了充分地利用不同模态内的自有特征,提出一种多模态特征融合和自蒸馏的红外-可见光行人重识别方法。首先提出一种基于双分类器的注意力融合机制,为各模态的自有特征赋予较大的融合权重,共有特征赋予较小的融合权重,得到含有各模态判别性自有特征的多模态融合特征;为了提升网络特征的鲁棒性以适应行人外观的变化,构建一个记忆存储器来存储行人的多视角特征;还设计了一种自蒸馏无参数动态引导策略,在多模态融合特征和多视角特征的引导下,利用该策略动态强化网络的多模态推理和多视角推理能力;最后网络能够从一个行人的单模态图像推理出另一模态不同视角行人特征,提升模型跨模态行人重识别的性能。基于PyTorch深度学习框架,在公开数据集SYSU-MM01和RegDB上与当前主流的方法进行对比实验,结果表明,所提方法的Rank-1分别达到63。12%和92。55%,mAP分别达到61。51%和89。55%,优于对比方法。

    跨模态行人重识别特征融合注意力机制记忆存储机制自蒸馏

    基于运动引导图卷积网络的人体动作识别

    李晶晶黄章进邹露
    1077-1086页
    查看更多>>摘要:针对当前基于骨架的人体动作识别方法无法建模关节点之间依赖关系随时间的变化,以及难以实现跨时空信息交互的问题,提出基于运动引导图卷积网络的人体动作识别方法。首先根据骨架序列提取其高级运动特征;然后在时间维度上学习运动相关图,并通过对预定义图和可学习图优化建模不同时期的关节依赖关系,即运动引导拓扑图;再利用运动引导拓扑图进行空间图卷积,将运动信息融合到空间图卷积以实现跨时空信息交互;最后交替使用时空图卷积,实现人体动作识别。在数据集NTU-RGB+D和NTU-RGB+D 120上与MS-G3D等图卷积网络进行对比实验的结果表明,所提方法在NTU-RGB+D的跨对象和跨视角上的准确率分别提升到92。3%和96。7%,在NTU-RGB+D 120的跨对象和跨场景上的准确率分别提升到88。8%和90。2%。

    动作识别图卷积人体骨架运动引导拓扑图

    基于文本数据的篮球赛事可听化系统

    余旻婧李俊沂蔡明旭庞德龙...
    1087-1095页
    查看更多>>摘要:篮球作为世界上普及程度最高的运动之一,其相关赛事受到众多体育爱好者的关注,具有极高的社会与经济价值。对于以美国职业篮球联赛为代表的国际顶尖篮球赛事,每年数以千计的比赛场次和动辄超过2h的视频时长往往让渴望能高效地筛选兴趣赛事或定位精彩瞬间的观众望而却步。为此,设计了基于文本数据的篮球赛事可听化系统。首先从球赛文本实况报道数据中顺序提取关键词并映射至特定旋律,实现数据从文本至音频的跨模态表达;然后将枯燥的球赛文本数据转化为音乐片段,解决部分场景下用户视觉通道被占用无法观看比赛的问题,为用户在较短时间内筛选兴趣赛事提供了可能。以2021年度NBA季后赛为例,所提系统平均单场比赛对应音乐片段生成仅需0。094 s,音频时长缩短为对应比赛视频时长的12。27%。通过38人参与的用户实验结果表明,该系统在高效地反映比赛进程的同时,也给用户提供了良好的球赛欣赏体验。

    篮球赛事可听化音乐摘要