首页期刊导航|计算机应用
期刊信息/Journal information
计算机应用
计算机应用

张景中

月刊

1001-9081

bjb@joca.cn

028-85224283(或85222239)转803

610041

成都市人民南路四段九号(成都237信箱)

计算机应用/Journal Journal of Computer ApplicationsCSCD北大核心CSTPCD
查看更多>>《计算机应用》月刊,于1981年创刊,由中国科学院成都计算机应用研究所主办,是国内较早公开发行的计算机技术刊物,在计算机自动化领域有较大影响。《计算机应用》紧紧围绕“应用”,登载应用、开发中的高水平学术技术论文、重大应用成果和典型应用经验。读者对象为各行业、各部门从事计算机应用基础、应用工程、应用软件、应用系统工作的工程技术人员、科研人员和大专院校师生。《计算机应用》多次荣获全国优秀科技期刊奖、国家期刊奖提名奖,被评为中国期刊方阵双奖期刊、中文核心期刊和中国科技核心期刊。被中国科学引文数据库、中国科技论文统计源数据库等国家重点检索机构列为引文期刊,并被英国《科学文摘》(SA)、俄罗斯《文摘杂志》(AJ)、日本《科学技术文献速报》(JST)、美国《剑桥科学文摘:材料信息》(CSA:MI)、美国《乌利希国际期刊指南》(UIPD)等国际重要检索系统列为来源期刊。《计算机应用》月刊内容新颖、信息丰富、印刷精美(大16开本,290页),是您学习计算机应用理论,借鉴计算机应用技术,参考计算机应用经验的最佳选择。
正式出版
收录年代

    可变形卷积网络的解释性研究及其在蝴蝶物种识别模型中的应用

    王璐刘东刘卫光
    261-274页
    查看更多>>摘要:近年来,可变形卷积网络(DCN)广泛运用于图像识别和分类等领域,然而对该模型的可解释性研究较为有限,它的适用性缺乏充分理论支持.针对上述问题,提出DCN的解释性研究及其在蝴蝶物种识别模型中的应用.首先,引入可变形卷积对VGG16、ResNet50和DenseNet121(Dense Convolutional Network121)分类模型进行改进;其次,采用反卷积和类激活映射(CAM)等可视化手段来对比可变形卷积和标准卷积在特征提取能力上的差异,且通过消融实验结果表明可变形卷积在神经网络的较低层且不连续使用时效果更佳;再次,提出显著性移除(SR)并对CAM的性能和激活特征重要性进行统一评价,同时通过设置不同的移除阈值等多个角度,提高评价的客观性;最后,基于评价结果更高的FullGrad(Full Gradient-weighted)解释模型识别的判断依据.实验结果显示,在Archive_80数据集上,所提出的D_v2-DenseNet121的准确率达到97.03%,相较于DenseNet121分类模型提高了2.82个百分点.可见,可变形卷积的引入赋予了神经网络模型不变性特征提取能力,并提高了分类模型的准确率.

    可变形卷积网络可解释性蝴蝶物种识别类激活映射显著性移除

    用于红外-可见光图像分类的跨模态双流交替交互网络

    郑宗生杜嘉成雨荷赵泽骋...
    275-283页
    查看更多>>摘要:多特征模态融合时存在噪声的叠加,而为减小模态间的差异采用的级联方式的结构也未充分利用模态间的特征信息,因此设计一种跨模态双流交替交互网络(DAINet)方法.首先,构建双流交替增强(DAE)模块,以交互双分支形式融合模态特征,并通过学习模态数据的映射关系,以红外-可见光-红外(IR-VIS-IR)和可见光-红外-可见光(VIS-IR-VIS)的双向反馈调节实现模态间噪声的交叉抑制;然后,构建跨模态特征交互(CMFI)模块,并引入残差结构将红外-可见光模态内以及模态间的低层特征和高层特征进行有效融合,从而减小模态间的差异并充分利用模态间的特征信息;最后,在自建红外-可见光多模态台风数据集及RGB-NIR多模态公开场景数据集上进行实验,以验证DAE模块和CMFI模块的有效性.实验结果表明,与简单级联融合方法相比,所提的基于DAINet的特征融合方法在自建台风数据集上的红外模态和可见光模态上的总体分类精度分别提高了6.61和3.93个百分点,G-mean值分别提高了6.24和2.48个百分点,表明所提方法在类别不均衡分类任务上的通用性;所提方法在RGB-NIR数据集上的2种测试模态下的总体分类精度分别提高了13.47和13.90个百分点.同时,所提方法在2个数据集上分别与IFCNN(general Image Fusion framework based on Convolutional Neural Network)和DenseFuse方法进行对比的实验结果表明,所提方法在自建台风数据集上的2种测试模态下的总体分类精度分别提高了9.82、6.02和17.38、1.68个百分点.

    跨模态深度学习图像分类特征学习双流网络

    基于信息补偿的红外弱小目标检测方法

    杨博然蔺素珍李大威禄晓飞...
    284-291页
    查看更多>>摘要:针对红外弱小目标容易在网络迭代过程中损失纹理细节信息,从而导致目标定位和轮廓分割的准确性下降的问题,提出一种基于信息补偿的红外弱小目标检测方法.首先,利用图像特征提取(IFE)模块编码红外源图像的浅层细节及深层语义特征;其次,构建多级信息补偿(MIC)模块通过聚合相邻级别的特征对编码阶段下采样后的特征进行信息补偿;随后,引入全局目标响应(GTR)模块联合特征图的全局上下文信息对卷积局部性的限制进行补偿;最后,构建非对称交叉融合(ACF)模块对浅层和深层特征进行融合,以实现目标解码时纹理信息与位置信息的保留,进而完成对红外弱小目标的检测.在公开的NUAA-SIRST(Nanjing University of Aeronautics and Astronautics-Single-frame InfraRed Small Target)和 NUDT-SIRST(National University of Defense Technology-Single-frame InfraRed Small Target)混合数据集上训练和测试的实验结果表明,与UIUNet(U-Net in U-Net Network)、LSPM(Local Similarity Pyramid Modules)和DNANet(Dense Nested Attention Network)等方法相比,所提方法在交并比(IoU)上分别提高了9.2、8.9和5.5个百分点,在F1分数(F1-Score)上分别提高了6.0、5.4和3.1个百分点.以上表明所提方法对红外复杂背景图像中的弱小目标可以实现准确检测和有效分割.

    目标检测红外弱小目标信息补偿全局目标响应非对称交叉融合

    融合注意力和上下文信息的遥感图像小目标检测算法

    刘赏周煜炜代娆董林芳...
    292-300页
    查看更多>>摘要:对多尺度的遥感图像进行小目标检测时,基于深度学习的目标检测算法容易出现误检和漏检的情况.这是因为此类算法的特征提取模块进行了多次的下采样操作;而且未能根据不同类别、不同尺度的目标关注所需的上下文信息.为了解决该问题,提出一种融合注意力和上下文信息的遥感图像小目标检测算法ACM-YOLO(Attention-Context-Multiscale YOLO).首先,应用细粒度的查询感知稀疏注意力以减少小目标特征信息的丢失,从而避免漏检;其次,设计局部上下文增强(LCE)函数以更好地关注不同类别的遥感目标所需的上下文信息,从而避免误检;最后,使用加权双向特征金字塔网络(BiFPN)强化特征融合模块对遥感图像小目标的多尺度特征融合能力,从而改善算法检测效果.在DOTA数据集和NWPU VHR-10数据集上进行对比实验和消融实验,以验证所提算法的有效性和泛化性.实验结果表明,在2个数据集上所提算法的平均精确率均值(mAP)分别达到了77.33%和96.12%,而相较于YOLOv5算法,召回率分别提升了10.00和7.50个百分点.可见,所提算法能有效提升mAP和召回率,减少误检和漏检.

    遥感图像小目标检测稀疏采样局部上下文信息增强多尺度特征融合

    基于多维空间卷积信息增强的低质车牌信息超分辨率重建

    张睿惠永科张延军潘理虎...
    301-307页
    查看更多>>摘要:现有交通监控终端采集到的车辆影像通常存在远景低分辨率现象,并伴随有强噪、模糊、过曝、欠曝等一些不确定性像素影响因素,导致车牌信息智能识别的精度难以保证.针对上述问题,提出基于多维空间卷积信息增强的低质车牌信息超分辨率重建(LL-SR)网络.首先,利用卷积挖掘空间与通道特征点的相关性,聚合浅层特征;其次,从不同感受野和不同维度挖掘特征图之间的关联关系,从而恢复车牌信息的高频细节;最后,对得到的不同尺度特征进行跨通道像素级融合和矫正,以减少无用特征在上下文的传播,实现低质车牌信息的超分辨率重建.在太原车牌(LT)和美国车牌(LU)数据集上的实验结果表明,所提网络的峰值信噪比(PSNR)和结构相似性(SSIM)分别为26.682 4 dB和0.820 3及22.356 7 dB和0.781 3,相较于NGramSwin(N-Gram in Swin transformers)和CARN(CAscading Residual Network)分别提升了 0.210 9 dB和 1.736 1 dB、0.005 7 和 0.033 0 及 0.472 8 dB和 1.419 2 dB、0.019 6 和0.039 9;且重建后的车牌信息具有更好的视觉效果.

    低质车牌信息高质量重建卷积计算交通监控

    利用全局-局部特征依赖的反欺骗说话人验证系统

    张嘉琳任庆桦毛启容
    308-317页
    查看更多>>摘要:针对现有卷积模型为主的反欺骗说话人验证系统捕获全局特征依赖不理想的问题,提出一种利用全局-局部特征依赖的反欺骗说话人验证系统.首先,对于欺骗语音检测模块,设计两种滤波器组合方式对原始语音进行滤波,并通过对频率子带的掩蔽实现样本扩充;其次,提出多维全局注意力机制,通过对信道维度、频率维度和时间维度分别进行池化,获得每个维度的全局依赖关系,并将全局信息通过加权的方式与原始特征相融合;最后,在说话人验证部分引入统计金字塔池化时延神经网络(SPD-TDNN),在获取多尺度时频特征的同时计算特征的标准差,并加入全局信息.实验结果表明,与集成时频图卷积(AASIST)模型相比,在ASVspoof2019数据集上提出的欺骗语音检测系统将等错误率(EER)降低了65.4%;与单独的金字塔池化说话人验证系统相比,提出的反欺骗说话人验证系统将欺骗感知说话人验证等错误率降低了约97.8%.以上验证了所提两个模块借助全局特征依赖能实现更好的分类效果.

    说话人验证数据增强频率掩蔽注意力机制欺骗语音检测

    结合字节级别字节对编码的端到端中文语音识别方法

    付强徐振平盛文星叶青...
    318-324页
    查看更多>>摘要:针对语音识别中对中文这种复杂字符集的语言词汇表过大以及训练效率太低的问题,提出一种基于字节级别字节对编码(BBPE)的端到端中文语音识别方法.首先,将256个不同的字节用于初始化词汇表;其次,统计每个词汇单元在语料中出现的频率,并合并频率最高的词汇单元;最后,重复上一步直至无法合并,以得到最终的词汇表.在中文语音数据集AISHELL-1上,该方法生成的词汇表相较于字符级别词汇表的词汇量减少了88.5%,降低了模型训练的复杂度.同时,鉴于Conformer-Transducer(Conformer-T)模型在端到端语音识别中的出色表现,为了实现更好的识别效果,将最新的Zipformer模型与Transducer模型相结合提出Zipformer-Transducer(Zipformer-T)模型,并在该模型上对BBPE方法进行验证.实验结果表明,Zipformer-T模型使用的BBPE方法相较于字符级别分词方法在AISHELL-1测试集和验证集上的字错率(CER)分别降低了0.12和0.08个百分点,且分别达到4.26%和3.98%的最低CER,充分说明该方法能有效提升中文语音识别的性能.

    语音识别ConformerZipformer字节级别字节对编码端到端

    地下封闭水体内多无人艇协同的视觉定位方法

    车文博王建华郑翔吴恭兴...
    325-336页
    查看更多>>摘要:针对无人艇(USV)在地下封闭水体中卫星定位信号缺失、通信受限、环境光线弱等问题,提出一种地下封闭水体内多USV协同的视觉定位方法.首先,设计一种艇载光源合作标志物,并根据艇身结构与应用场景对标志物结构进行优化;其次,采用单目视觉采集标志物图像,并求取特征点的图像坐标;再次,根据摄像机成像模型,基于合作标志物特征点的空间坐标及其对应的图像坐标之间的关系,通过改进直接线性变换方法求解相邻艇间的相对位置;然后,利用前后艇的摄像机进行艇间对视,并通过最小方差算法,融合根据前后艇摄像机图像求解所得的相对位置,以提高相对定位精度;最后,利用场景中已知的绝对坐标,获得各无人艇的绝对位置.仿真实验对影响定位误差的因素进行分析,并把所提方法与传统直接线性变换方法进行对比.结果表明,随着距离的增加,所提方法求解优势更趋明显,在距离15 m时求解的位置方差稳定在0.2 m2以内,验证了所提方法的准确性.静态实验结果表明,所提方法能将相对误差稳定在10.0%以内;地下河道内的动态实验结果表明,所提方法求解的绝对定位的航行轨迹达到与卫星定位相当的精度,验证了所提方法的可行性.

    水面无人艇协同定位单目视觉合作标志物地下封闭水体

    基于全局状态预测与公平经验重放的交通信号控制算法

    缪孜珺罗飞丁炜超董文波...
    337-344页
    查看更多>>摘要:为了应对交通拥堵而设计的高效交通信号控制算法能提升现有交通网络下的车辆通行效率.尽管深度强化学习算法在单路口交通信号控制问题上已展现出卓越的性能,然而这些算法在多路口环境下的应用仍然面临着重大的挑战——多智能体强化学习(MARL)算法产生的时间和空间的部分可观测性引发的非平稳性问题会导致这些算法无法稳定的收敛.因此,提出一种基于全局状态预测与公平经验重放的多路口交通信号控制算法IS-DQN.一方面,基于不同车道的车流历史信息预测多路口的全局状态,从而扩展IS-DQN的状态空间,以避免算法产生空间部分可观测性而带来非平稳性问题;另一方面,为应对传统经验重放策略的时间部分可观测性,采用蓄水池抽样算法来保证经验重放池的公正性,进而避免其中的非平稳性问题.在复杂的多路口环境下应用IS-DQN算法进行3种不同的交通压力仿真实验的结果表明:在不同交通流情况下,尤其是在中低交通流量下,相较于独立的深度强化学习算法,IS-DQN算法能得到更短的车辆平均行驶时间,并表现出了更优的收敛性能与收敛稳定性.

    深度强化学习交通信号控制时序预测蓄水池抽样算法长短期记忆

    征稿启示

    封2页