首页期刊导航|计算机科学
期刊信息/Journal information
计算机科学
计算机科学

朱完元

月刊

1002-137X

jsjkx12@163.com

023-63500828

401121

重庆市渝北区洪湖西路18号

计算机科学/Journal Computer ScienceCSCD北大核心CSTPCD
查看更多>>本刊的读者对象是:大专院校师生,从事计算机科学与技术领域的科研、生产人员。办刊宗旨是:坚持“双百”方针,活跃计算机科学与技术领域的学术气氛,重点报导国内外计算机科学与技术的发展动态,为我国的计算机科学与技术立于世界之林、达到国际先进水平奋斗而矢志不渝。
正式出版
收录年代

    三维点云上采样方法研究综述

    韩冰邓理想郑毅任爽...
    167-196页
    查看更多>>摘要:随着深度相机、激光雷达等三维扫描设备的普及,用点云表示三维数据的方法越来越流行,对点云数据的分析与处理也引起了计算机视觉研究领域的极大兴趣.其中,点云上采样任务是一项重要的点云数据处理工作,其结果的好坏关系着下游多种任务的优劣,因此一些研究人员从多个角度深入探索并先后提出了多种点云上采样方法,以期提高计算效率和网络性能,解决点云上采样中的各种难点问题.为了促进之后研究的发展,首先从任务类型角度对现有的点云上采样方法进行了全面的分类与综述,然后对这些点云上采样网络的性能进行了详细的分析与对比,最后针对现存的问题与面临的挑战做了进一步分析,并探索了未来可能的研究方向,希望为三维点云上采样任务未来更深入的研究提供新思路.

    三维点云上采样方法深度神经网络自监督学习三维重建

    基于彩色图像高频信息引导的深度图超分辨率重建算法研究

    李嘉莹梁宇栋李少吉张昆鹏...
    197-205页
    查看更多>>摘要:深度图像信息是三维场景信息的重要组成部分,然而,由于采集设备的局限性和成像环境的多样性,深度传感器获取的深度图像往往分辨率较低、高频信息较少,限制了其在各种计算机视觉任务中的进一步应用.深度图超分辨率试图提高深度图的分辨率,是一项实用而有价值的任务.同一场景下的RGB图像分辨率高,纹理信息丰富,部分深度图超分辨率算法通过引入来自同一场景下的RGB图像提供指导信息,实现了算法性能的显著提升.然而,由于RGB图像和深度图之间的模态不一致,如何充分、有效地利用RGB信息辅助深度图像进行图像超分辨率重建仍然极具挑战.为此,提出了一种基于彩色图像高频信息引导的深度图超分辨率重建算法.具体地,设计了一个高频特征提取模块来自适应地学习彩色图像中的高频信息,以指导深度图边缘的重建.另外,设计了一个特征自注意力模块来获取特征之间的全局依赖,同时提取更深层次的特征,以帮助深度图细节信息的恢复.经过跨模态融合,重组深度图像特征和彩色图像引导特征,并使用多尺度特征融合模块融合不同尺度特征之间的空间结构信息,获取包含多级感受野的重建信息.最后,通过深度重建模块,恢复相应的高分辨率深度图.公开数据集上的实验结果表明所提方法在定量和定性两方面均优于对比方法,验证了所提方法的有效性.

    深度图超分重建深度学习跨模态特征融合高频信息自注意力机制

    一种基于YOLOX_s的雾天场景目标检测方法

    娄铮铮张欣胡世哲吴云鹏...
    206-213页
    查看更多>>摘要:文中提出了一个基于深度可分离卷积和注意力机制的雾天目标检测模型,旨在实现在雾天场景中对目标的快速、准确检测.该模型由去雾模块和检测模块组成,并在训练过程中共同训练.为确保模型在雾天场景中检测的准确性和实时性,在去雾模块方面,采用AODNet对输入图像进行去雾处理,以降低雾对图像中待检测目标的干扰,在检测模块中使用改进后的YOLOX_s模型,输出目标的分类置信度和位置坐标.为提升网络的检测性能,在YOLOX_s基础上采用深度可分离卷积和注意力机制来提高特征提取能力,扩大特征图感受野.所提模型能提高有雾场景中模型的检测精度,且不增加模型参数量和计算量.实验结果表明,所提模型在RTTS数据集和合成有雾目标检测数据集上均表现出色,有效提高了模型在雾天场景中的检测精度.与基准模型相比,平均精度(mAP@50_95)分别提升了1.9%和2.37%.

    雾天场景目标检测图像去雾深度可分离卷积注意力机制

    基于外部先验和自先验注意力的图像描述生成方法

    李永杰钱艺文益民
    214-220页
    查看更多>>摘要:图像描述是一种结合计算机视觉和自然语言处理的跨模态任务,旨在理解图像内容并生成恰当的句子.现有的图像描述方法通常使用自注意力机制来捕获样本内的长距离依赖关系,但这种方式不仅忽略了样本间的潜在相关性,而且缺乏对先验知识的利用,导致生成内容与参考描述存在一定差异.针对上述问题,文中提出了一种基于外部先验和自先验注意力(Ex-ternal Prior and Self-prior Attention,EPSPA)的图像描述方法.其中,外部先验模块能够隐式地考虑到样本间的潜在相关性进而减少来自其他样本的干扰信息.同时,自先验注意力能够充分利用上一层的注意力权重来模拟先验知识,使其指导模型进行特征提取.在公开数据集上使用多种指标对EPSPA进行评估,实验结果表明该方法能够在保持低参数量的前提下表现出优于现有方法的性能.

    图像描述自注意力机制潜在相关性外部先验模块自先验注意力

    三维流场的流线深度特征学习与特征聚类

    陈杰金林江郑红波秦绪佳...
    221-228页
    查看更多>>摘要:流场可视化指将流体运动的数据转换为视觉形式,以便更好地理解和分析流场的流动.利用流线来实现流场可视化,是当前最为热门的方法.文中提出了一种学习、聚类三维流场流线特性的方法.首先设计了一种基于卷积的自编码器来提取流线特征.该方法中的自编码器由编码器和解码器组成,其中编码器用卷积层降维的方式来提取输入流线的特征,而解码器使用转置卷积对流线特征进行上采样,以此重建流线.通过训练不断减小输入流线与重建流线的差异,可以让编码器提取到的流线特征更加准确.其次,改进了CFSFDP算法,用于流线特征聚类.针对原CFSFDP算法需要手动选取聚类中心,以及对距离参数过于敏感的缺点,改进了其指标计算方法,实现对聚类中心的自动选取,并且引入了高斯核密度估计,实现对截断距离参数的自适应计算.实验结果表明,所提方法在流线特征的学习以及聚类上具有良好的效果.

    流场可视化流线特征卷积自编码器聚类

    基于改进双流视觉Transformer的行为识别模型

    雷永升丁锰沈尧李居昊...
    229-235页
    查看更多>>摘要:针对现有行为识别方法中抗背景干扰能力差和准确率低等问题,提出了一种改进的双流视觉Transformer行为识别模型.该模型采用分段采样的方法来增加模型对长时序列数据的处理能力;在网络头部嵌入无参数的注意力模块,在降低动作背景干扰的同时,增强了模型的特征表示能力;在网络尾部嵌入时间注意力模块,通过融合时域高语义信息来充分提取时序特征.文中提出了一种新的联合损失函数,旨在增大类间差异并减少类内差异;采用决策融合层以充分利用光流与RGB流特征.针对上述改进模型,在基准数据集UCF101和HMDB51上进行消融及对比实验,消融实验结果验证了所提方法的有效性,对比实验结果表明,所提方法相比时间分段网络在两个数据集上的准确率分别提高了3.48%和7.76%,优于目前的主流算法,具有较好的识别效果.

    行为识别视觉TransformerSimAM无参注意力时间注意力联合损失

    基于RepVGG网络的实时车道线检测方法

    蔡汶良黄俊
    236-243页
    查看更多>>摘要:针对现有车道线检测方法存在的检测速度慢、检测精度低的问题,将车道线检测视为分类问题,提出了基于RepVGG网络的实时车道线检测方法.在RepVGG网络中融合不同层级特征图,减少空间定位信息的损失,提高车道线的定位精度.采用曲线建模的后处理方法,从整体和局部两个角度修正车道线预测结果.挖掘车道线定位中的分布信息,提出了基于分布指导的车道线存在预测分支,直接从车道线定位分布中学习车道线的存在特征,在略微提升推理速度的同时进一步提升检测精度.在TuSimple和CULane数据集上的实验表明,该模型在检测速度和精度上取得了良好的平衡.在CULane数据集上,所提方法的推理速度为目前同类方法中检测速度最快的UFLDv2算法的1.13倍,同时F1分数从74.7%提高到77.1%,达到了实时检测任务的需求.

    计算机视觉RepVGG车道线检测曲线拟合特征融合后处理

    企业架构引领数字化转型|TF135回顾

    CCF微信公众号
    243页

    基于图像深度先验和鲁棒马尔可夫随机场的有遮挡人脸识别

    李小薪丁伟杰方怡张远成...
    244-256页
    查看更多>>摘要:由遮挡所引发的测试数据和训练数据之间的差异,是人脸识别技术面临的重要挑战.现有的基于深度神经网络的有遮挡人脸识别方法大多需要使用大规模的有遮挡的人脸图像来训练网络模型.然而,现实世界中的任何外界物体都有可能成为遮挡,有限的训练集数据很难穷尽所有的可能性,并且使用大规模的有遮挡人脸图像训练网络模型的做法与人类视觉机制是相违背的,人眼对于遮挡区域的感知在本质上与遮挡本身并没有关系,仅依赖于无遮挡的人脸图像.为了模拟人类视觉的遮挡检测机制,将图像深度先验和鲁棒马尔可夫随机场模型结合起来,构建基于小样本数据的遮挡检测模型DIP-rMRF,并提出了一致性零填充方法以有效利用DIP-rMRF的遮挡检测结果进行后续的人脸识别.在Extended Yale B,AR和LFW 这3个人脸数据库上,针对 VGGFace,LCNN,PCANet,SphereFace,InterpretFR,FROM 这 6 种 CNN 模型的 实验结果表明,DIP-rMRF 能够有效地处理遮挡以及由极端光照所引发的"类遮挡",从而极大提升现有的深度神经网络模型对有遮挡人脸识别的性能.

    有遮挡人脸识别图像深度先验鲁棒马尔可夫随机场一致性零填充结构误差度量

    轻量级深度神经网络模型适配边缘智能研究综述

    徐小华周长兵胡忠旭林仕勋...
    257-271页
    查看更多>>摘要:随着物联网和人工智能的迅猛发展,边缘计算和人工智能的结合催生了边缘智能这一新的研究领域.边缘智能具备一定的计算能力,能够提供实时、高效和智能的响应.它在智能城市、工业物联网、智能医疗、自动驾驶以及智能家居等领域都具有重要的应用.为了提升模型的准确度,深度神经网络往往采用更深、更大的架构,导致了模型参数的显著增加、存储需求的上升和计算量的增大.受限于物联网边缘设备在计算能力、存储空间和能源资源方面的局限,深度神经网络难以被直接部署到这些设备上.因此,低内存、低计算资源、高准确度且能实时推理的轻量级深度神经网络成为了研究热点.文中首先回顾边缘智能的发展历程,并分析轻量级深度神经网络适应边缘智能的现实需求,提出了两种构建轻量级深度神经网络模型的方法:深度模型压缩技术和轻量化架构设计.接着详细讨论了参数剪枝、参数量化、低秩分解、知识蒸馏以及混合压缩5种主要的深度模型压缩技术,归纳它们各自的性能优势与局限,并评估它们在常用数据集上的压缩效果.之后深入分析轻量化架构设计中的调整卷积核大小、降低输入通道数、分解卷积操作和调整卷积宽度的策略,并比较了几种常用的轻量化网络模型.最后,展望轻量级深度神经网络在边缘智能领域的未来研究方向.

    边缘智能深度神经网络轻量级神经网络模型压缩轻量化架构设计