首页期刊导航|计算机科学
期刊信息/Journal information
计算机科学
计算机科学

朱完元

月刊

1002-137X

jsjkx12@163.com

023-63500828

401121

重庆市渝北区洪湖西路18号

计算机科学/Journal Computer ScienceCSCD北大核心CSTPCD
查看更多>>本刊的读者对象是:大专院校师生,从事计算机科学与技术领域的科研、生产人员。办刊宗旨是:坚持“双百”方针,活跃计算机科学与技术领域的学术气氛,重点报导国内外计算机科学与技术的发展动态,为我国的计算机科学与技术立于世界之林、达到国际先进水平奋斗而矢志不渝。
正式出版
收录年代

    首届CCF公益日启动,技术分论坛探讨信息无障碍生态发展

    CCF微信公众号
    171页

    基于图神经网络的乳腺癌病理图像分析方法综述

    陈思硕王晓东刘西洋
    172-185页
    查看更多>>摘要:病理诊断是癌症诊断和治疗过程中的金标准,利用人工智能模型对癌症病理图像进行自动分析不仅可以减轻病理学家的工作负担,还可以提高诊断结果的准确性.然而,病理图像的大尺度特点以及对预测结果可解释性的高要求为人工智能模型带来了巨大的挑战.在近年来的研究中,图神经网络在建模图像中实体的空间上下文关系及可解释性方面都展现出了强大的能力,为数字病理的研究提供了新的思路.文中回顾了近年来计算机视觉领域的相关工作,分析了图神经网络在乳腺癌病理图像分析中的优势,分类和比较了现有的面向乳腺癌病理图像的图构建方法,分析和对比了乳腺癌病理图像分析中的图神经网络模型,整理了近年来的研究中常用的工具包与公开数据集,总结了基于图神经网络的乳腺癌病理图像分析研究中存在的挑战并对未来的研究方向进行了展望.

    乳腺癌病理图像图神经网络图分类数字病理

    异质虹膜识别研究综述

    孔佳琳张琪王财勇
    186-197页
    查看更多>>摘要:虹膜图像采集环境和设备的不同导致虹膜注册和识别样本差异较大,给传统的虹膜识别技术带来了挑战.异质虹膜识别问题已成为学术界和工业界关注的焦点.文中从不同层级、样本差异性以及单源和多源3个角度对现有的异质虹膜识别方法进行了分类和综述,总结了 目前异质虹膜识别的最新进展.按照跨质量、跨设备和跨光谱的分类对现有的异质虹膜数据集进行综述,并总结概述虹膜识别评价指标,以便研究人员更好地评估和验证算法的性能.最后,从环境鲁棒性、数据异质性建模和多模态融合3个方向,对未来异质虹膜识别研究的发展方向进行了展望.

    虹膜识别异质图像生物特征深度学习

    基于对比学习的视觉增强多模态命名实体识别

    于碧辉谭淑月魏靖烜孙林壮...
    198-205页
    查看更多>>摘要:多模态命名实体识别(MNER)的目的是在给定的图像-文本对中检测实体范围并将其分类为相应的实体类型.尽管现存的MNER方法取得了成功,但它们都集中在使用图像编码器提取视觉特征后,不做增强或过滤处理,直接送入跨模态交互机制.此外,由于文本和图像的表示来自不同的编码器,很难弥合两种模态之间的语义鸿沟,因此,提出了 一个基于对比学习的视觉增强多模态命名实体识别模型(MCLAug).首先,使用ResNet收集图像特征,在此基础上提出金字塔双向融合策略,将低层次高分辨率和高层次强语义的图像信息结合起来,以增强视觉特征.其次,利用CLIP模型中的多模态对比学习思想,计算并最小化对比损失,使两种模态的表示更加一致.最后,利用跨模态注意力机制和门控融合机制获得融合后的图像和文本表示,并通过CRF解码器来执行MNER任务.在两个公开数据集上进行了对比实验并进行消融研究和案例研究,结果证明了所提模型的有效性.

    多模态命名实体识别CLIP多模态对比学习特征金字塔Transformer门控融合机制

    基于加权有界形变函数的可形变图像配准模型

    闵莉花丁田中金正猛
    206-214页
    查看更多>>摘要:可形变图像配准是图像处理领域中一个非常重要的课题,是计算机视觉中最基本的问题之一,也是医学图像分析的一个难题.文中研究了两幅单模态灰度图像之间的图像配准问题,充分考虑了参考图像的边缘信息,提出了 一个新的基于加权有界形变函数的可形变图像配准模型.首次提出了加权的有界形变函数空间,给出了该空间的定义及相关结论,并从理论上证明了所提模型解的存在性.同时,利用梯度下降法设计了有效的算法进行数值求解,分别在合成图像和医学图像上进行数值实验.实验结果和定量评估结果表明,与对比模型相比,所提模型由于引入了控制函数且将加权有界形变函数作为正则项,得到了更精确的配准结果,特别是在图像边缘及一些细节处配准效果有明显提高.

    可形变图像配准加权有界形变函数变分方法梯度下降法

    基于BEV占位预测的激光-毫米波雷达融合目标检测算法

    李越豪王邓江鉴海防王洪昌...
    215-222页
    查看更多>>摘要:激光雷达工作环境中的光束衰减和目标遮挡会导致输出点云出现远端稀疏的问题,从而引起基于激光雷达的3D目标检测算法的检测精度随距离衰减的现象.针对这一问题,提出了 一种基于鸟瞰图视角(BEV)空间内 目标占位预测的激光-毫米波雷达融合目标检测算法.首先提出了一种简化的BEV占位预测子网络,用于生成位置相关的毫米波雷达特征,同时有助于解决毫米波雷达数据稀疏带来的网络收敛困难的问题.然后,为了实现跨模态特征融合,设计了一种基于BEV空间特征关联的多尺度激光-毫米波雷达特征融合层结构.在nuScenes数据集上进行实验,结果表明,所提出的毫米波雷达分支网络的平均检测精度(mAP)达到21.6%,推理时间为8.3ms.在加入融合层结构后,多模态检测算法较基线算法CenterPoint的mAP提升了 2.9%,同时增加的额外推理时间开销仅为8.6 ms,在距离传感器30m位置处,多模态算法对于nuScenes数据集中10个类别的检测精度达成率分别较CenterPoint提升了 2.1%~16.0%.

    3D目标检测激光雷达毫米波雷达占位预测鸟瞰图视角特征融合

    基于自适应光子和分层色散图的实时色散渲染方法

    罗元孟张军
    223-230页
    查看更多>>摘要:焦散是光线经过反射或折射后汇集形成的高亮区域现象,色散是由于折射焦散中不同波长的单色光折射率差异而出现的彩色光谱现象,是渲染逼真半透明物体时复杂和耗时的光照计算步骤.在渲染色散时,现有光线追踪技术必须依赖高端GPU硬件才能实现实时渲染.基于图像空间的焦散图技术,文中提出一种简洁、高效的实时色散渲染方法.提出了采样7个单色光并自适应调整7色光子尺寸的方法,用于近似整条色散光谱的渲染;并提出了分层色散图策略,避免了光子光栅化尺寸的增加,提高了渲染效率.实验结果表明,所提方法在个人电脑上可做到实时渲染,以离散采样光谱的7个单色光模拟了整条连续光谱,减少了渲染的计算量和存储量,并且改善了基于图像空间技术的噪点问题.

    色散实时渲染图像空间技术光谱焦散

    融合Transformer与多阶段学习框架的点云上采样网络

    李泽锴柏正尧肖霄张奕涵...
    231-238页
    查看更多>>摘要:借鉴Transformer在自然语言和计算机视觉领域强大的特征编码能力,同时受多阶段学习框架的启发,设计了 一种融合Transformer与多阶段学习框架的点云上采样网络——MSPUiT.该网络采用二阶段网络模型,第一阶段是密集点生成网络,利用多层Transformer编码器逐步实现从输入点云的局部几何信息、局部特征信息到点云高级语义特征的转换,特征扩充模块在特征空间中,对点云特征上采样,坐标回归模块将点云从特征空间重新映射回欧氏空间中初步生成密集点云M';第二阶段是逐点优化网络,使用Transformer编码器对密集点云M'中潜藏的语义特征进行编码,联合上一阶段语义特征得到点云完整的语义特征,特征精炼单元从M'的几何信息和语义特征中提取点的误差信息特征,误差回归模块从误差信息特征中计算得到欧氏空间中点的坐标偏移量,实现对点云M'的逐点优化,使得点云上点的分布更加均匀,并且更加贴近真实物体表面.在大型合成数据集PU1K上进行了大量实验,MSPUiT生成的高分辨率点云在倒角距离(CD)、豪斯多夫距离(HD)、生成点云到原始点云块的距离(P2F)上的指标分别降至0.501×10-3,5.958×10-3,1.756×10-3.实验结果表明,MSPUiT上采样后的点云表面更加光滑,噪声点更少,生成的点云质量高于当前主流的点云上采样网络.

    Transformer编码器多阶段学习框架特征转换点云上采样深度学习

    多粒度空间注意力与空间先验监督的DETR

    廖峻霜谭钦红
    239-246页
    查看更多>>摘要:近年来,Transformer在视觉领域的表现卓越,由于其优秀的全局建模能力以及可媲美CNN的性能表现受到了广泛关注.DETR(Detection Transformer)是在其基础上研究的首个在目标检测任务上采用Transformer架构的端到端网络,但是其全局范围内的等价建模以及目标查询键的无差别性导致其训练收敛缓慢,且性能表现欠佳.针对上述问题,利用多粒度的注意力机制替换DETR的encoder中的 自注意力以及decoder中的交叉注意力,在距离近的token之间使用细粒度,在距离远的token之间使用粗粒度,增强其建模能力;并在decoder中的交叉注意力中引入空间先验限制对网络训练进行监督,使其训练收敛速度得以加快.实验结果表明,在引入多粒度的注意力机制和空间先验监督后,相较于未改进的DETR,所提改进模型在PASCAL VOC2012数据集上的识别准确度提升了 16%,收敛速度快了 2倍.

    多粒度空间注意力空间先验监督目标检测视觉Transformer编解码架构

    基于眼部特征频域信息的早期疲劳检测

    火星星胡瑞敏李怡欣
    247-255页
    查看更多>>摘要:行李X光安检员工作疲劳是造成错检、漏检的重要原因.目前疲劳检测的方法主要通过发现打哈欠、打瞌睡和长时间闭眼等明显的迹象来检测中晚期疲劳,然而对于安检工作人员来说,出现这样明确的标志时,可能已经发生了安检事故,此时再进行疲劳检测为时已晚.因此,在早期阶段发现疲劳,并对疲劳的发生及时预警是非常有价值的.由于早期疲劳会有细微的面部表现特性,时域参数的不可逆性导致其无法完全表示.为了解决此问题,提出了 一种基于眼部特征频域信息的行李X光安检员早期疲劳检测方法,将原始时域信息转换到表达能力更强的频域特征空间.该方法首先通过面部检测算法获取眼部横纵比(Eye Aspect Ratio,EAR)时间序列;然后利用频域特征提取方法得到频域特征序列,来表示更加细微的特征;最后利用分层多尺度网络HM-LSTM进行训练及验证.在公开数据集UTA-RLDD上的对比实验结果表明,所提方法对早期疲劳的识别率提升了 2%,证明了频域特征比时域特征有更好的表达能力.

    眼睛横纵比频域特征时频转换早期疲劳机场安检