首页期刊导航|计算机工程
期刊信息/Journal information
计算机工程
华东计算技术研究所 上海市计算机学会
计算机工程

华东计算技术研究所 上海市计算机学会

游小明

月刊

1000-3428

hdsce@sohu265359.sohuvip.net

021-54972331

200233

上海市桂林路418号

计算机工程/Journal Computer EngineeringCSCD北大核心CSTPCD
查看更多>>本刊是中国电子科技集团公司第三十二研究所(华东计算技术研究所)主办的学术性刊物,是上海市计算机学会会刊。主要特点:以最快的速度、科学求实的精神,精选刊登代表计算机行业前沿科研、技术、工程方面的高、精、尖优秀论文。贯彻党的“双百”方针,繁荣科技创作,促进国内外学术交流,探讨和传播计算机科学的理论和实践,加速和促进我国计算机事业的发展。
正式出版
收录年代

    基于逐像素强化学习的边缘保持图像复原

    江敏陈飞程航王美清...
    224-232页
    查看更多>>摘要:高强度的高斯噪声往往会模糊或破坏图像的细节和结构,导致边缘信息的丢失。为此,提出基于逐像素强化学习的边缘保持图像复原算法。首先,为每个像素构建一个像素层智能体并设计针对边缘处的侧窗均值滤波器到动作空间中,所有的像素层智能体共享优势行动者-评论家算法的参数,因此模型可以同时输出所有位置的状态转移概率并选择合适的策略进行状态转移,从而复原图像;其次,在特征提取共享网络中结合协调注意力,聚焦所有像素位置在特征通道间的全局信息,并保留位置嵌入信息;然后,为了缓解稀疏奖励问题,设计一个基于图拉普拉斯正则的辅助损失,关注图像的局部平滑信息,对局部不平滑区域加以惩罚,从而促进像素层智能体更加有效地学习到正确的策略以实现边缘保持。实验结果表明,所提的算法在Middlebury2005数据集和MNIST数据集上的峰值信噪比(PSNR)分别达到32。97 dB和28。26 dB,相比于Pixel-RL算法分别提升了 0。23 dB和0。75 dB,参数量和训练总时间分别减少了 44。9%和18。2%,在实现边缘保持的同时有效降低了模型的复杂度。

    图像复原深度强化学习逐像素强化学习协调注意力图拉普拉斯边缘保持

    渐进式特征增强的弱监督显著性目标检测

    李沼洁朱恒亮毛国君杨鑫...
    233-244页
    查看更多>>摘要:针对多数弱监督显著性检测方法在复杂场景下容易出现目标结构缺损、边界粗糙等问题,提出一种渐进式特征增强的弱监督显著性检测算法。首先针对显著目标结构不完整问题,设计一种渐进式特征增强机制,主要包括双流语义增强模块和层次化自适应特征聚合模块,通过复用这种机制可以捕获更丰富的图像特征;其次为获取清晰完整的目标边缘,提出边缘引导模块,可以生成高质量的显著目标边缘图;最后将得到的边缘对显著区域预测网络进行指导,以生成结构完整且边界平滑的检测结果。在5个公开数据集上的实验结果表明,相比经典的WSSA算法,该算法在PASCAL-S数据集上平均绝对误差(MAE)降低了 21。32%,F-measure值提高了 6。27%,优于大多数先进的弱监督显著性目标检测算法。

    弱监督显著性目标检测渐进式特征聚合边缘引导

    半导体器件内部缺陷标注与检测方法研究

    白宇王珺冉红雷安胜彪...
    245-253页
    查看更多>>摘要:半导体器件封装过程中出现的内部空洞缺陷会直接影响电子设备的性能。针对半导体器件X射线内部图像空洞缺陷中尺度不一、难标注、难定位及噪声干扰等问题,提出半自动标注方法和基于U-Net的器件内部空洞缺陷检测方法。半自动标注方法使用阈值分割初步定位缺陷区域,生成缺陷的外接矩形框,然后人工对矩形框进行精细化修改和完善,作为提示输入到分段任意模型(SAM)中,得到高精度的分割结果。半自动标注方法能够节省标注时间且提高标签质量,克服标注难题。针对经典U-Net方法泛化性较差的问题,提出一种改进的U-Net方法(EFU-Net)。首先在编码器中引入边缘位置增强(EPE)模块,通过结合Sobel滤波器和坐标注意力机制加强对图像边缘信息的感知,有效整合位置信息,以提高特征提取的准确性;然后引入特征融合控制(FFC)模块替代传统的跳跃连接,融合高层特征、低层特征和预测掩码3个特征,并利用多层并行空洞卷积和注意力门控机制实现更有针对性和高质量的特征融合。在半导体器件数据集上的实验结果表明,EFU-Net的Dice系数和MIoU分别达到70。71%、77。23%,与U-Net方法相比,分别提升了 14和7。71个百分点,具有更好的分割性能。

    缺陷检测语义分割半自动标注边缘位置增强注意力机制特征融合控制

    基于多特征融合的食品图像分类

    叶志鹏姜枫
    254-264页
    查看更多>>摘要:随着生活水平的提升,人们对健康饮食的需求与日俱增,食品图像识别成为热门研究课题之一。食品加工和烹饪过程的不同造成了同类食品的形状和颜色存在差异,不同类别的食品也可能会呈现相似的视觉特征,因此食品图像的识别较一般图像识别难度更大。为了解决上述问题,提出基于多特征融合的食品图像分类网络MTFNet。首先,将图像的RGB彩色通道数据与局部二值模式(LBP)对应的纹理特征相融合作为骨干挤压和激励网络(SENet)的输入。接着,利用细节注意力模块挖掘不同位置上各通道的权重,进而对各层特征图进行局部增强,提升特征图局部表征能力。然后,利用自注意力机制计算特征图各通道之间的自注意力权重,挖掘特征图间的相关性,提取图像的全局特征。最后,将局部增强特征和全局特征拼接融合后进行图像分类。实验结果表明,在食品图像数据集ETH Food101、ChineseFoodNet和ISIA Food-500上,与目前最佳的多尺度拼图重构网络(MJR-Net)模型相比,MTFNet模型的Top-1准确率分别提高了 0。44、1。01和0。66个百分点,取得了更好的识别性能。

    食品图像分类局部二值模式挤压和激励网络细节注意力自注意力

    高动态场景下无人机空对空目标检测

    王林赵莉王无为
    265-275页
    查看更多>>摘要:针对高动态场景下无人机(UVA)空对空目标检测任务中机载设备计算资源有限和UVA小目标检测困难的问题,提出一种基于轻量级注意力机制的无人机空对空目标检测算法SGC-YOLOv5。首先,设计S-Ghost模块和SD-Ghost结构构建特征提取网络SD-GhostNet,降低模型参数量和计算复杂度;其次,引入更高效的GSConv和VOVGSCSP结构细化特征融合网络,将SD-GhostNet和细化的特征融合网络相结合使模型达到最佳的轻量化效果;最后,在特征融合网络中加入轻量级卷积块注意力模块(CBAM)来突出图像中感兴趣的UVA特征,抑制背景冗余信息,提高检测精度。在数据集Det-Fly上的实验结果表明,SGC-YOLOv5算法的精确率为74。9%、参数量为4 313 695、检测速度为169。42帧/s、每秒浮点运算次数(FLOPs)为9。0×109,与基准YOLOv5s算法相比,检测精确率提升2。5%、参数量减少48。5%、检测速度提升26。17帧/s、FLOPs降低57。5%,在实现模型轻量化的同时取得了较好的检测精确率。

    视觉目标检测无人机空对空目标检测YOLOv5算法轻量化注意力机制

    基于文本的行人图像检索的多样化数据扩充方法

    王靖尧曹敏
    276-287页
    查看更多>>摘要:近年来,基于文本的行人图像检索(TBPS)技术在安防和刑侦等领域发挥着越来越重要的作用。然而,现有数据集中行人图像较少且描述行人的文本较为单调导致模型无法充分学习行人特征和信息,限制了 TBPS检索技术的进一步发展。为了解决这一问题,提出一种多样化行人图像-文本对数据生成与筛选的扩充方法。在数据生成阶段,首先使用成分句法分析模型和大语言模型相结合的方式生成行人文本描述,然后使用条件图像生成模型根据生成的行人文本描述产生相应的行人图像。在依据行人文本筛选图像阶段,利用评分函数PickScore计算生成的行人图像与行人文本描述之间的相似度分数,根据计算的相似度分数的结果,粗粒度地筛掉相似度分数较低的行人图像,只保留相似度分数较高的行人图像与行人文本描述。在行人图像-文本对数据过滤阶段,利用图文多模态大模型计算行人图像与行人文本描述的匹配概率,筛掉概率低于阈值的行人图像-文本对进行细粒度的数据过滤,并将剩余的高质量行人图像-文本对作为正样本对添加到现有数据集中。在多个公开的TBPS检索数据集上的实验结果表明,应用该方法对这些数据集进行扩充后,不同检索基准模型的Rank-k、平均精度均值(mAP)等指标均有较大幅度的提升。此外,探讨了姿态控制与风格控制对扩充结果的影响,为后续更深入的研究提供了一种思路。

    多样化行人数据扩充成分句法分析模型大语言模型条件图像生成模型多模态大模型

    意图注意力引导的小样本3D点云目标检测

    徐守坤张路军石林刘毅...
    288-295页
    查看更多>>摘要:现有的点云目标检测方法往往要求严苛的监督式数据集,这带来了人力、物力等方面的挑战。因此提出一种创新性的解决方案,即采用元学习框架来克服大量标注数据的困扰。对小样本学习技术在3D点云目标检测中的应用进行研究。这一方法能够基于有限的新类别标注样本,预测未标注样本的分类,从而在有限数据条件下仍能取得良好效果。引入原型投票网络来学习类别的几何原型以及支持集的类别原型。此外,为了学习点云上下文信息,引入意图注意力机制,以实现更加精准的信息融合。在原型生成方面,为避免点云原型过度依赖最大池化而丧失大量信息,采用平均池化方法来生成原型。与基准数据集上的基线模型相比,该方法呈现出显著且一致的提升效果,为点云目标检测领域的研究和应用提供了有力支持。

    点云目标检测小样本投票网络意图注意力

    基于条件扩散模型的图像分类对抗样本防御方法

    陈子民关志涛
    296-305页
    查看更多>>摘要:深度学习模型在图像分类等领域取得了较好的结果,但是深度学习模型容易受到对抗样本的干扰威胁,攻击者通过对抗样本制作算法,精心设计微小扰动,构造肉眼难以分辨却能引发模型误分类的对抗样本,给图像分类等深度学习应用带来严重的安全隐患。为提升图像分类模型的鲁棒性,利用条件扩散模型,提出一种综合对抗样本检测和对抗样本净化的对抗样本防御方法。在不修改目标模型的基础上,检测并净化对抗样本,提升目标模型鲁棒性。所提方法包括对抗样本检测和对抗样本净化2个模块。对于对抗样本检测,采用不一致性增强,通过训练一个融入目标模型高维特征和图片基本特征的图像修复模型,比较初始输入和修复结果的不一致性,检测对抗样本;对于对抗样本净化,采用端到端的对抗样本净化方式,在去噪模型执行过程中加入图片伪影,实现对抗样本净化。在保证目标模型精度的前提下,在目标模型前增加对抗样本检测和净化模块,根据检测结果,选取相应的净化策略,从而消除对抗样本,提升目标模型的鲁棒性。在CIFAR10数据集和CIFAR100数据集上与5种现有方法进行对比实验,实验结果表明:对于扰动较小的对抗样本,所提方法的检测精度较Argos方法提升了 5~9个百分点;相比于ADP方法,所提方法在面对不同种类对抗样本时防御效果更稳定,且在BPDA攻击下,其对抗样本净化效果较ADP方法提升了 1。3个百分点。

    对抗防御对抗样本检测对抗样本净化扩散模型图像去噪

    基于字形约束和注意力的艺术字体风格迁移

    吕文锐普园媛赵征鹏张衡...
    306-317页
    查看更多>>摘要:艺术字体的风格迁移是一项非常有趣但又十分具有挑战性的任务,具体来说就是将目标字体的艺术风格通过某种映射方式迁移到源字体上。现有方法在字形风格迁移方面存在鲁棒性有限的不足,且当2种不同风格的字形相差较大时不能很好地将风格内容迁移到目标字体上。针对以上问题,提出一种端到端的通用网络框架模型,并在模型中引入自注意力机制和自适应实例归一化,用于实现在给定的多个文本效果域之间进行任意字体的艺术风格迁移。该模型主要包括1个生成器和2个鉴别器,还有1个额外的风格编码器。为了更好地做到字形约束以及提升网络的性能,设计几种损失函数来优化生成对抗网络(GAN)的训练。为了验证该模型的有效性,采用了 FET-GAN任务中公开的艺术字体数据集。实验对比了 6种先进的方法,并从定量和定性2个方面进行了比较。实验结果表明,所提模型能够实现带有字体变换的字形图像风格迁移,迁移结果能够保持很好的字形结构,并且FID值为72。355,低于对比实验中最好的结果91。435。

    字体风格迁移自注意力自适应实例归一化生成对抗网络字形约束

    基于改进YOLOv7的PCB缺陷检测算法

    张旭陈慈发董方敏
    318-328页
    查看更多>>摘要:在PCB缺陷检测领域中检测精度的提高一直是1个具有挑战性的任务。为了解决这个问题,提出一系列基于PCB缺陷检测的改进方法。首先,引入一种新的注意力机制,即BiFormer注意力机制,这种机制利用双层路由实现动态的稀疏注意力,从而减少计算量;其次,采用一种创新的上采样算子CARAFE,能够结合语义信息与内容信息进行上采样,使得上采样过程更加全面且高效;最后,基于MPDIoU度量采用一种新的损失函数,即LMPDIoU损失函数,能够有效地处理不平衡类别、小目标和密集性问题,从而进一步提高图像检测的性能。实验结果表明,所提改进后的模型在平均精度均值(mAP)方面取得了显著提高,达到了 93。91%,与原YOLOv5模型相比提高了 13。12个百分点,同时,在识别精度方面,所提改进后的模型表现也非常出色,达到了 90。55%,与原YOLOv5模型相比提高了 8。74个百分点。引入 BiFormer注意力机制、CARAFE上采样算子以及LMPDIoU损失函数,对于提高PCB缺陷检测的精度和效率具有非常积极的作用,为工业检测领域的研究提供了有价值的参考。

    PCB缺陷BiFormer注意力机制MPDIoU损失函数上采样算子CARAFE目标检测