首页期刊导航|计算机科学
期刊信息/Journal information
计算机科学
计算机科学

朱完元

月刊

1002-137X

jsjkx12@163.com

023-63500828

401121

重庆市渝北区洪湖西路18号

计算机科学/Journal Computer ScienceCSCD北大核心CSTPCD
查看更多>>本刊的读者对象是:大专院校师生,从事计算机科学与技术领域的科研、生产人员。办刊宗旨是:坚持“双百”方针,活跃计算机科学与技术领域的学术气氛,重点报导国内外计算机科学与技术的发展动态,为我国的计算机科学与技术立于世界之林、达到国际先进水平奋斗而矢志不渝。
正式出版
收录年代

    基于注意力机制的残差特征聚合网络超分辨率图像重建研究

    孙阳丁建伟张琪魏慧雯...
    441-446页
    查看更多>>摘要:针对单图像超分辨率算法级联残差块的输出特征仅在局部作用的问题,提出了一种结合注意力机制的残差特征聚合网络.该网络通过跳跃连接将各残差块输出不同层次的特征聚合到残差组的尾部,实现特征的充分提取与复用,扩大网络的感受野并增强特征的表达能力,使得不同层次的特征图更充分地参与到图像重建中.同时,为增强特征信息空间上的相关性,引入增强空间注意力机制以改善残差块的性能.大量实验表明,此模型可以获得良好的超分辨率性能.在×4倍SR任务中与RCAN,SAN和HAN等主流方法相比,在5个基准测试集上取得的峰值信噪比平均提升0.07dB,0.06dB,0.006 dB,结构相似度平均提升0.0012,0.0011,0.0008,重建图像质量明显提高,细节更加丰富,充分说明了所提方法的有效性与先进性.

    图像超分辨率重建深度学习注意力机制特征聚合卷积神经网络

    感受野扩展与多分支聚合的目标检测方法

    阙越甘梦晗刘志伟
    447-452页
    查看更多>>摘要:目标检测旨在实现对图像中目标的精确识别和定位,是计算机视觉中一个重要的研究领域.基于深度学习的目标检测已取得长足的发展,但依然存在不足之处.大的下采样系数带来的语义信息有利于图像分类,但下采样过程中不可避免地会造成信息损失,导致模型特征提取不充分,从而检测准确性下降.针对上述问题,提出一种感受野增强与多分支聚合模型用于目标检测.首先,设计感受野增强模块,以扩大主干网络的感受野.该模块可以获取目标上下文线索,且不改变特征的空间分辨率,可以缓解下采样过程中目标信息丢失问题.然后,为了充分利用卷积神经网络的局部性以及自注意力机制的长距离特征依赖特性,构建感受野扩展复合主干网络,以保留局部特征以及提高模型的全局特征感知能力.最后,提出多分支聚合检测头网络,在3个预测分支之间形成信息流动,融合分支之间的特征信息,以提高模型检测能力.在MS COCO数据集上进行了验证实验,结果表明所提模型的平均精度优于多种主流目标检测模型.

    目标检测自注意力机制感受野扩展特征融合解耦检测头

    基于跨域小样本学习的SAR图像目标识别方法

    史松昊王晓丹杨春晓王艺菲...
    453-459页
    查看更多>>摘要:由于SAR图像获取难度大,可供研究的样本数量较少,解决有限样本条件下SAR图像目标识别问题成为业界公认的挑战.随着深度学习在计算机视觉领域的发展,衍生出了多种小样本图像分类方法,因此考虑采用跨域小样本学习范式解决小样本SAR图像目标识别问题.具体地,先在多个源域中训练得到不同域的特征提取器,而后通过知识蒸馏的方法获取一个通用的特征提取器,这里采用中心核对齐的方法,将提取的特征映射到一个更高维的空间,从而更好地区分原特征之间的非线性相似性;通过上一阶段获得的通用特征提取器提取目标域图像特征,最后采用原型网络的方法预测样本的类别.实验证明,该方法在缩减模型参数的同时,获得了88.61%的准确率,为解决小样本SAR图像目标识别问题提供了新的思路.

    深度学习元学习跨域小样本学习SAR图像目标识别知识蒸馏

    基于有损压缩编码的降噪自编码器

    袁振刘进锋
    460-466页
    查看更多>>摘要:图像预处理算法的优劣程度直接关系到图像后置处理的效果,如图像分割、目标检测、边缘提取等.为了获取高质量的数字图像,对图像进行降噪处理成了必不可少的前置步骤.图像降噪旨在尽可能地保持原始信息完整性(即主要特征)的同时,又能够去除信号中无用的信息.为此,提出了一种基于有损压缩编码的卷积自编码器(AutoEnconders,AE)去噪模型;并根据最大编码率下降原则(the principle of Maximal Coding Rate Reduction,MCR2)设计了新的损失函数代替主流深度学习算法中常用的均方误差(Mean Squared Error,MSE)损失,以提高模型的鲁棒性和适应性.模型首先通过编码器处理带噪图像,得到隐变量,然后使用解码器进行解码,消除噪声并得到重构图像.接下来,保持编码器不变,将重构图像输入编码器,使编码器继续学习并得到重构隐变量.最后,通过计算隐变量与重构隐变量的距离来间接衡量重构图像与原始图像的误差,并将其作为收敛代价进行模型训练.在thumbnails128×128和CBSD68数据集上对所提模型进行了大量实验验证.实验结果表明,该自编码器框架(AE-MCR2)在不同类型的噪声(高斯噪声、伯努利噪声和泊松噪声)下均表现出良好的性能,并具有一定的可解释性.

    计算机视觉图像去噪自编码器卷积神经网络压缩编码

    基于改进FCOS的遥感图像舰船目标检测

    陈天鹏胡建文
    467-473页
    查看更多>>摘要:由于遥感图像中舰船目标方向任意,基于深度学习的通用目标检测算法采用水平框,在检测舰船时易框选大量背景,检测效果欠佳.文中提出一种改进全卷积一阶段目标检测网络(FCOS)的遥感图像舰船目标检测算法,以FCOS为基线,在检测头部分增加一条偏移回归分支,通过偏移水平框的上边中点和右边中点,产生旋转框.舰船目标通常具有较大的长宽比,预测框与真实框之间的角度偏差对交并比的影响较大,进而影响模型的检测精度.针对该问题,在计算偏移损失时引入与舰船目标长宽比有关的加权因子,使得具有较大长宽比的目标获得较大的偏移损失.在HRSC2016数据集上的实验结果表明,所提算法的平均精确度达到89.00%,检测速度达到19.8FPS,相比同类型的无锚框算法,其在检测速度和检测精度上均表现优秀.

    遥感图像舰船目标检测FCOS无锚框算法偏移分支

    基于统计分析的仿射运动估计快速算法

    钟煜城黄晓峰牛伟宏崔燕...
    474-481页
    查看更多>>摘要:为降低新一代通用视频编码标准(Versatile Video Coding,VVC)的计算复杂度,提出了一种基于统计分析的仿射运动估计(Affine Motion Estimation,AME)快速算法.从加速 AME过程的角 度出发,首先摒弃 AME的3种运动矢量(Motion Vector,MV)精度中的整像素和1/16像素精度,保留1/4像素精度;其次利用迭代次数与量化参数(Quantization Parameter,QP)、slice类型以及编码单元(Coding Unit,CU)大小的关系,得到一个迭代次数的自适应计算式来减少AME迭代次数;然后将细粒度搜索(Fine Granularity Search,FGS)算法中CU 4个角落的4个整像素用2个对角分像素进行替代;最后运用绝对变换差和(Sum of Absolute Transform Difference,SATD)代价来替代率失真(Rate Distortion Optimization,RDO)代价.实验结果表明,与H.266/VVC参考软件VTM-10.0相比,提出的算法在低延迟(Low Delay B,LDB)和随机访问(Random Access,RA)配置下分别节省了8.34%和8.83%的时间,与此同时性能损失仅为0.10%和0.12%.

    通用视频编码仿射运动估计像素精度细粒度搜索绝对变换差和

    面向嵌入式平台的光学遥感图像舰船检测识别

    何鑫宇陆陈鑫冯书谊欧阳尚荣...
    482-488页
    查看更多>>摘要:建设海洋强国是我国当前大力发展的战略方向.针对现有基于深度学习的遥感图像舰船目标检测识别算法在嵌入式平台上存在检测分类识别率低、运行速率慢等问题,提出了一种基于寒武纪MLU220嵌入式平台改进的Mix-YOLO网络模型.该模型以YOLOv7-tiny网络为基本框架,首先,引入MobileNet系列网络模块对特征提取网络进行部分替换,减少网络参数量;然后,引入ULSAM注意力机制,以便增强网络学习分类能力,减少虚警率;最后,为了显著提升嵌入式平台检测速率,采用将网络模型大模块拆分为小模块的编写方式.实验结果表明:Mix-YOLO算法在原YOLOv7-tiny网络基础上,参数量和计算量分别下降了39.70%和29.70%,处理帧率由97.27 fps提升至120.88fps,精度提高了7.7%,能够实现对遥感图像中舰船目标的实时检测识别.

    光学遥感图像舰船检测轻量级网络注意力机制嵌入式平台

    基于多模态视频分类任务的模态融合策略研究

    王一帆张雪芳
    489-493页
    查看更多>>摘要:尽管过往人工智能相关技术在众多领域取得了成功,但是通常只是模拟了人类的某一种感知能力,也就意味着被限制在处理单个模态的信息之中.从多个模态信息中提取特征并进行有效融合对于从弱/限制领域人工智能向强/通用人工智能的发展迈进具有重要意义.本研究基于编码器-解码器结构,在视频分类任务上对多模态信息的特征编码进行早期特征融合、对各模态信息的预测结果进行后期决策融合以及对两者相结合的不同多模态信息融合策略进行了对比研究;同时对音频模态信息参与模态融合的两种方式进行了对比,即直接将音频进行特征编码进而参与模态融合或音频通过语音转文本进而以文本的形式参与模态融合.实验结果表明,将文本和音频模态单独的预测结果与另外两种模态的融合特征的预测结果进行决策融合能够进一步提高分类预测准确率;此外,通过语音识别将语音转换成文本模态信息,能够更加充分利用其中包含的语义信息.

    多模态模态融合语音识别视频分类

    基于多尺度局部特征融合的行人重识别方法

    吴蕾王海瑞朱贵富赵江河...
    494-499页
    查看更多>>摘要:针对现有行人重识别方法在提取行人特征时存在特征不对齐、忽略相邻区域语义相关性、背景杂乱以及训练效率低的问题,提出一种多尺度局部特征融合的方法.首先引入空间变换网络对图像进行自适应仿射变换,实现行人空间特征对齐;接着横向均等分割不同尺度的特征图,对相邻局部块采取不同的拼接方式,以弥补切割造成的相邻块关联性信息缺失的问题;再融合全局特征与局部特征,挖掘二者之间的关联性.同时,融入随机擦除的方法对数据集进行处理,防止模型过拟合;并且使用多种损失函数对网络模型进行训练,提升模型的类内紧致性和类间差异性.将所提方法在Market-1501和DukeMTMC-ReID数据集上进行实验,Rank-1分别达到95.0%,88.8%,mAP分别达到89.2%,78.9%,结果表明所提方法能够提取更具判别力的行人特征.

    行人重识别局部特征特征空间分割空间变换网络随机擦除

    复杂光照环境下的标识线图像增强方法

    吴静樊绍胜胡成扬
    500-504页
    查看更多>>摘要:自动驾驶汽车在行驶过程中需要识别道路标识线以确保行驶在车道上,变电站巡检机器人通过识别道路标识线实现准确巡检.但由于复杂光照环境的影响,道路标识线信息难以准确提取.传统的图像增强方法无法对所有复杂光照环境下的道路标识线图像都产生良好的增强效果,对此提出一种复杂光照环境下的道路标识线图像增强方法.利用HSV色域空间的亮度图像的亮度差进行分层处理,对高亮度差的图像使用自适应伽马校正的方法进行图像增强,对低亮度差的图像先使用直方图锥形拉伸扩大图像灰度级,再利用自适应伽马校正提升图像对比度.实验结果表明,该算法能有效解决低光照、曝光等复杂光照环境所导致的道路标识线难以识别的问题,是一种有效的图像增强方法.

    图像增强伽马校正直方图锥形拉伸HSV色彩空间复杂光照