首页期刊导航|计算机工程
期刊信息/Journal information
计算机工程
华东计算技术研究所 上海市计算机学会
计算机工程

华东计算技术研究所 上海市计算机学会

游小明

月刊

1000-3428

hdsce@sohu265359.sohuvip.net

021-54972331

200233

上海市桂林路418号

计算机工程/Journal Computer EngineeringCSCD北大核心CSTPCD
查看更多>>本刊是中国电子科技集团公司第三十二研究所(华东计算技术研究所)主办的学术性刊物,是上海市计算机学会会刊。主要特点:以最快的速度、科学求实的精神,精选刊登代表计算机行业前沿科研、技术、工程方面的高、精、尖优秀论文。贯彻党的“双百”方针,繁荣科技创作,促进国内外学术交流,探讨和传播计算机科学的理论和实践,加速和促进我国计算机事业的发展。
正式出版
收录年代

    基于Transformer视觉特征融合的图像描述方法

    白雪冰车进吴金蔓陈玉敏...
    229-238页
    查看更多>>摘要:现有图像描述方法只利用区域型视觉特征生成描述语句,忽略了网格型视觉特征的重要性,并且均为两阶段方法,从而影响了图像描述的质量。针对该问题,提出一种基于Transformer视觉特征融合的端到端图像描述方法。首先,在特征提取阶段,利用视觉特征提取器提取出区域型视觉特征和网格型视觉特征;其次,在特征融合阶段,通过视觉特征融合模块对区域型视觉特征和网格型视觉特征进行拼接;最后,将所有的视觉特征送入语言生成器中以生成图像描述。该方法各部分均基于Transformer模型实现,实现了一阶段方法。在MS-COCO数据集上的实验结果表明,所提方法能够充分利用区域型视觉特征与网格型视觉特征的优势,BLEU-1、BLEU-4、METEOR、ROUGE-L、CIDEr、SPICE指标分别达到 83。1%、41。5%、30。2%、60。1%、140。3%、23。9%,优于目前主流的图像描述方法,能够生成更加准确和丰富的描述语句。

    图像描述区域型视觉特征网格型视觉特征Transformer模型端到端训练

    用于建筑物分割的平行结构特征融合网络

    赵婉秋张俊虎李海涛
    239-248页
    查看更多>>摘要:遥感建筑物分割是对遥感图像中的建筑物进行像素级别的分割,从遥感图像中准确提取出建筑物区域,包括建筑物轮廓和内部细节信息。由于遥感图像的特殊性,在对建筑物分割时,阴影与建筑物颜色相似易造成欠分割,树木遮挡等因素易造成过分割。针对遥感图像中建筑物轮廓分割不完整、阴影干扰强以及分割边缘锯齿状明显等问题,提出一种平行结构的多分支特征融合网络(MFF-Net)。该网络以ResNet-50作为主干网络,解码器采用包含双通道掩码分支的多条平行结构,分别恢复不同尺度的特征图。同时,在每条分支结构中使用改进后的CBAM注意力以加强边缘重要特征,通过双通道掩码结构调整通道交互性,最后进行特征融合。在ISPRS Potsdam和ISPRS Vaihingen数据集上的实验结果表明,与现有主流分割网络相比,MFF-Net的全局准确率、精确率、召回率、F1值、均交并比(mIoU)均有不同程度的提升,在Vaihingen数据集上精确率达到96。22%,F1值达到95。55%,mIoU达到92。16%,在Potsdam数据集上精确率达到96。95%,F1值达到96。32%,mIoU达到93。40%,其提取的建筑物轮廓完整清晰,抗干扰性更强。

    遥感图像特征融合建筑物分割双通道掩码注意力

    基于Swin-Transformer的黑色素瘤图像病灶分割研究

    赵宏王枭
    249-258页
    查看更多>>摘要:黑色素瘤图像病灶分割的主流模型大多基于卷积神经网络(CNN)或Vision Transformer(ViT)网络,但是CNN模型受限于感受野大小,无法获取全局上下文信息,而ViT模型只能提取固定分辨率的特征,无法提取不同粒度的特征。为解决该问题,建立一种基于Swin-Transformer的融合双分支的混合模型SwinTransFuse。在编码阶段,首先利用Noise Reduction图像降噪模块去除图像中的毛发等噪声,然后采用CNN和Swin-Transformer构成的双分支特征提取模块来提取图像的局部细粒度信息和全局上下文信息,并对来自Swin-Transformer分支的全局上下文信息使用SE模块进行通道注意力操作以增强全局特征的提取,对来自CNN分支的局部细粒度信息使用卷积块注意力机制模块(CBAM)进行空间注意力操作以增强局部细粒度特征的提取,接下来利用Hadamard积运算对两个分支输出的特征进行特征交互以实现特征的融合,最后将SE模块输出的特征、CBAM模块输出的特征和特征融合后的特征进行拼接以实现多层次特征融合,并通过一个残差块输出交互后的特征。在解码阶段,将特征输入到上采样模块得到图像最终的分割结果。实验结果表明,该模型在ISIC2017和ISIC2018皮肤病数据集上的平均交并比分别为78。72%和78。56%,优于同类型的其他医学分割模型,具有更高的实用价值。

    Swin-Transformer模型黑色素瘤特征融合降噪ISIC2018数据集

    基于深度特征抑制的遮挡人脸识别网络

    王富平刘鸿玮张锲石段冠庄...
    259-269页
    查看更多>>摘要:人脸识别技术是公安侦查中人证核验的关键技术之一。尽管现有算法在无遮挡人脸识别上都能达到较高的识别精度,但当人脸被遮挡时,使得有效的人脸特征丢失,导致识别精度大幅下降。针对上述问题,提出一种基于深度特征抑制的遮挡人脸识别网络,通过遮挡人脸自适应地生成特征掩码,利用特征掩码抑制深层特征图中因遮挡损坏的特征,最后根据抑制后的特征完成人脸识别。为了提升抑制后特征的辨别力,在训练环节通过孪生网络结构将遮挡人脸与对应无遮挡人脸的深度特征进行度量学习。同时利用不同层次的特征信息,构建特征金字塔网络(FPN)和自适应特征融合模块对人脸的多尺度特征信息进行提取,对其中包含特征信息较多的特征层赋予更大的融合权重,从而增强特征的表征能力。实验结果表明,该方法具有较好的鲁棒性,其中在LFW数据集和LFW 口罩遮挡数据集上的准确率分别达到了 99。50%和98。42%,在AR数据集4个实验设置上的准确率分别达到了 100%、100%、99。86%和99。02%,优于目前的主流算法。

    人脸识别遮挡人脸识别自适应特征融合特征掩码度量学习

    基于可见光与红外图像的弱光条件下目标检测

    王昱婷刘志明万亚平朱涛...
    270-281页
    查看更多>>摘要:图像融合是将多个输入图像合并成一个单一图像的技术。可见光红外图像融合能提高目标检测的准确性,但在低光照场景下往往效果不佳。基于此,提出一种新的融合模型DAPR-Net。该模型具有跨层残差连接的编解码结构,将编码器的输出与解码器的对应层的输入相连接,加强各层卷积层间的信息传递。在编码器中设计了双注意力特征提取模块AFEM,使得网络能够更好地区分融合图像与输入的可见光和红外图像之间的差异,同时保留两者的关键信息。在多个公开数据集上与6种先进方法进行对比,实验结果表明,与基准PIAFusion模型相比,该模型在LLVIP和MSRS数据集上的信息熵、空间频率、平均梯度、标准差、视觉保真度指标分别提高了0。849、3。252、7。634、10。38、0。293 和 2。105、2。23、4。099、27。938、0。343;在 YOLOV5目标检测网络上,LLVIP 和MSRS数据集的平均精度均值、召回率、精确率、F1值指标分别提高了 8。8、1。4、1。9、1。5个百分点和7。5、1。4、8。8、1。2个百分点,相较于其他融合方法表现出更显著的优势。

    低光照可见光红外图像图像融合目标检测

    基于多注意力机制与跨特征融合的语义分割算法

    闵莉董冰洁安冬
    282-289页
    查看更多>>摘要:图像语义分割技术在缺陷检测、医疗诊断、无人驾驶等领域广泛应用。针对现有语义分割模型普遍存在训练成本过高、目标轮廓分割效果不佳以及对小目标误分割、漏分割等问题,基于DeepLabv3+网络框架,提出多注意力机制与跨特征融合相结合的图像语义分割算法。该算法选取轻量级网络MobileNetv2作为主干,以缩短训练时间;通过优化空洞空间金字塔池化模块中空洞卷积的膨胀率,改善多尺度语义特征的提取效果,提高模型对小目标的分割能力,并将兼具通道与空间的卷积块注意力机制引入其中,更加关注对分割起决定作用的区域,从而加强对目标边界的提取;在编码器中设计跨特征融合模块,以聚合不同层次特征图的空间信息和语义信息,提高网络学习特征的能力;在编码和解码部分均引入坐标注意力机制,以分解全局平均池化的方式将位置信息嵌入到通道中,从而得到分割目标的准确位置。实验结果表明,所提算法F3crc-DeepLabv3+在PASCAL VOC 2012增强数据集和Cityspaces数据集上的平均交并比分别达到了 75。06%和73。06%,平均精度分别达到了 84。16%和82。05%,精确率分别达到了 86。18%和85。43%,训练时间分别为10 h和13。8 h,具有较优的网络性能。

    语义分割DeepLabv3+网络MobileNetv2网络坐标注意力卷积块注意力模块跨特征融合

    基于对比学习的非对称编解码结构的心脏MRI分割研究

    高爽史轶伦徐巧枝于磊...
    290-300页
    查看更多>>摘要:全监督方法在心脏磁共振成像(MRI)分割任务中的成功依赖于大规模标记数据集,然而由于患者隐私及人工标注困难等问题,心脏MRI标注数据规模较小,使全监督方法面临挑战。基于半监督的对比学习方法,设计双分支编码与单分支解码的心脏MRI分割网络CPCL-Net,引入图像和像素的联合对比损失,提升了模型对数据样本的特征表达能力。为了增强CPCL-Net对Hard负样本的分割精度,设计动态自适应加权模块(DAWM),利用生成的α和β权重因子评估样本级别和像素级别的训练贡献度,使模型分割精度得到大幅提升。基于自动心脏诊断挑战赛(ACDC)数据集的实验结果表明,该网络模型仅利用少量标注样本即可获得较高的分割精度,缓解了心脏MRI高质量标注样本不足导致的分割精度低下问题,并且在标注样本规模相同的情况下,对心脏左心室、右心室、心肌等部位的分割精度分别为86。17%、85。52%、84。55%,优于现有的4种典型半监督分割模型以及经典的对比学习框架Sim-CLR,有效缓解了全监督分割模型对样本规模的依赖及过拟合问题。

    对比学习动态自适应加权医学图像分割心脏磁共振成像联合损失函数

    基于残差自注意力和分离集合匹配的高效端到端航天器组件检测

    陈明牛燕菲段莉高铁梁...
    301-309页
    查看更多>>摘要:随着我国航天技术的迅猛发展,各种航天器相继发射,然而航天器在运行时将受到辐射、温度变化等不可控因素的影响,这会导致地面站无法精确测量和定位航天器的位置与姿态,从而对通信和航天器之间的对接或抓捕等空间在轨服务产生影响。为了解决上述问题,首先对包含检测、分割与部件识别的航天器数据集SDDSP中的部件进行人工标注,该数据集共包含3 117张航天器图片,标注后得到11 001个检测目标;然后提出一种空间在轨服务中基于残差自注意力(RS)和分离集合匹配(SSM)的高效端到端航天器组件检测模型,该模型在Sparse DETR模型的基础上引入残差自注意力机制解决了稀疏标记(token)导致的收敛速度降低并影响模型预测精度的问题,引入分离集合匹配机制解决了二分匹配过程中可能出现的不稳定性现象。实验结果表明,在SDDSP数据集上,该模型的平均精确率(AP)和收敛速度相比于基线DETR模型提升了 17。9个百分点和10倍,相比于Sparse DETR模型提升了 3。1个百分点和20%。

    航天器组件检测SparseDETR模型残差自注意力分离集合匹配航天器数据集

    基于卷积调制与空间协作的水下图像增强

    郭伟王欣哲王江达王春艳...
    310-318页
    查看更多>>摘要:针对光线在水中的散射和吸收效应造成水下图像纹理和结构不清晰的问题,提出一种基于卷积调制(CM)与空间协作(SC)的水下图像增强算法。以编码器-解码器作为基础网络,使用RepVGG的浅层和深层网络分别提取水下图像的纹理和结构特征。首先,特征主导网络将RepVGG中提取到的水下图像特征转化成具有不同尺度的纹理和结构特征,使其与解码器中的特征图进行拼接融合。其次,在编码器中使用卷积调制模块,采用深度可分离卷积(DSConv)模拟自注意力机制的方式减少图像细节信息的丢失,提高编码器特征提取的能力。最后,在解码器中使用空间协作卷积(SCConv),在空间维度上处理水下特征保留更多的位置信息,以提高解码器对融合后特征的增强能力。实验结果表明,该算法在视觉感知与性能指标上优于对比算法,峰值信噪比(PSNR)和结构相似性(SSIM)指标最高达到23。446 5 dB和0。894 6,水下彩色图像质量评价(UCIQE)和水下图像质量测量(UIQM)指标最高达到0。582 6和3。068 9,进一步证明了该算法能够有效增强水下图像的纹理和结构特征,具有较好的视觉感知效果。

    图像处理水下图像增强卷积调制空间协作编解码结构

    基于深度强化学习的自适应图像隐写算法

    钱清龙永蒋忠远段春红...
    319-327页
    查看更多>>摘要:针对自适应图像隐写中如何在轻量化隐写、最佳嵌入定位、高隐匿输出三者之间实现均衡的问题,提出一种基于深度强化学习的自适应图像隐写算法(AISA-DRL)。设计一种轻量化安全隐写网络,在降低模型隐写成本的前提下加强模型对图像隐写特征的提取能力,增强载密图像的安全性和稳定性。首先将具有高效特征融合特性的EPSANet引入EfficientnetV2-s,得到改进的EPSA-EfficientnetV2-s,以提高像素级嵌入过程的表征能力,从而获得最优像素修改位张量。随后将秘密信息与最优像素修改位张量加权求和得到载密图像。最后通过学习隐写分析网络对载密图像进行最优像素级奖励分配,根据设计的最小化失真函数通过梯度回传来更新网络参数,以获得最佳嵌入位置,从而实现秘密信息的最佳化嵌入。实验结果表明,AISA-DRL算法的模型参数量减少了94。22%,FLOPs减少了 24。88%,与其他基于强化学习的隐写方案相比,在不同经典隐写分析器下的检错率提高了 2。48%~6。55%。此外,在不同载荷下生成的载密图像PSNR值均在30 dB以上,不仅提高了模型对像素修改位的定位准确率,而且使隐写网络具有更强的表征能力。

    图像隐写强化学习隐写分析嵌入策略特征提取