首页期刊导航|计算机工程
期刊信息/Journal information
计算机工程
华东计算技术研究所 上海市计算机学会
计算机工程

华东计算技术研究所 上海市计算机学会

游小明

月刊

1000-3428

hdsce@sohu265359.sohuvip.net

021-54972331

200233

上海市桂林路418号

计算机工程/Journal Computer EngineeringCSCD北大核心CSTPCD
查看更多>>本刊是中国电子科技集团公司第三十二研究所(华东计算技术研究所)主办的学术性刊物,是上海市计算机学会会刊。主要特点:以最快的速度、科学求实的精神,精选刊登代表计算机行业前沿科研、技术、工程方面的高、精、尖优秀论文。贯彻党的“双百”方针,繁荣科技创作,促进国内外学术交流,探讨和传播计算机科学的理论和实践,加速和促进我国计算机事业的发展。
正式出版
收录年代

    基于多尺度时空注意力网络的微表情检测方法

    于洋孙芳芳吕华李扬...
    228-235页
    查看更多>>摘要:微表情可以揭示人们试图隐藏的真实情绪,为刑事侦查、心理辅导等提供潜在的信息。现有微表情检测方法主要在获取空间特征的基础上提取时间特征以构建时空特征,这种处理方式容易导致时间特征失真,同时在空间处理过程中会破坏原有时序关系,降低微表情时空特征的判别性。针对这一问题,提出基于多尺度时空注意力网络的微表情检测方法。利用包含时间和空间关系的三维卷积神经网络(3DCNN)对微表情序列进行处理,获取兼顾时间域和空间域的鲁棒性特征。构建多尺度时间输入序列,从不同时间长度的图像序列中提取多维时间特征,采用轻量级3DCNN提取多尺度时空特征,利用全局时空注意力模块(GSAM)对时空特征进行全局性时空关联加强,其中时空重组模块用于加强不同时刻图像帧之间的连通性,全局信息关注模块构建单帧图像上的空间关联信息,最后对不同时刻的特征赋予权重以突出关键时间信息,有效完成微表情检测工作。实验结果表明,该方法可以准确检测出微表情序列片段,在CASME、CASME Ⅱ和SAMM公开数据集上的准确率分别达到92。32%、95。04%和89。56%,相比目前最优的深度学习方法LGAttNet,所提方法在CASME Ⅱ和SAMM数据集上的准确率分别提高了 3。84和4。96个百分点。

    微表情检测三维卷积神经网络时空特征多尺度特征关联性

    基于特征融合的多波段图像描述生成方法

    贺姗蔺素珍王彦博李大威...
    236-244页
    查看更多>>摘要:针对现有图像描述生成方法普遍存在的对夜间场景、目标被遮挡情景和拍摄模糊图像描述效果不佳的问题,提出一种基于特征融合的多波段探测图像描述生成方法。将红外探测成像引入图像描述领域,首先利用多层卷积神经网络(CNN)对可见光图像和红外图像分别提取特征;然后根据不同探测波段的互补性,以多头注意力机制为主体设计空间注意力模块,以融合目标波段特征;接着应用通道注意力机制聚合空间域信息,指导生成不同类型的单词;最后在传统加性注意力机制的基础上构建注意力增强模块,计算注意力结果图与查询向量的相关权重系数,消除无关变量的干扰,从而实现图像描述生成。在可见光图像-红外图像描述数据集上进行多组实验,结果表明,该方法能有效融合双波段的语义特征,BLEU4指标、CIDEr指标分别达到58。3%和136。1%,能显著提高图像描述准确度,可以用于安防监控、军事侦察等复杂场景任务。

    图像描述图像融合多波段图像自注意力机制组合注意力

    基于光照校正和图像融合的零件表面图像增强

    董良振田建艳杨胜强陈海滨...
    245-254页
    查看更多>>摘要:在低照度条件下采集的机械加工零件表面图像质量较低,严重影响后续与粗糙度相关的特征提取效果。为此,提出一种基于光照校正和图像融合的低照度图像增强算法。首先对引导滤波算法进行改进,使其能根据图像的纹理情况自适应地调整滤波参数,在平滑纹理的同时保持整体结构,得到更优质的照度图;然后对原始图像进行反相增强,抑制图像中的高亮条纹与光斑,通过图像融合来综合原图和正、反相增强图像的优质像素;接着利用限制对比度的自适应直方图均衡化(CLAHE)算法进一步提高融合图像的对比度;最后将增强图像用于2种不同的零件表面粗糙度检测模型。在钛、钢、镁3种材质的零件表面低照度图像数据集上进行实验,结果表明,该算法有效增强了低照度零件表面图像的质量,增强图像的标准差、平均梯度和信息熵均高于对比算法。与图像增强前相比,基于灰度共生矩阵特征提取的支持向量回归(GLCM-SVR)和基于卷积回归神经网络(RCNN)的粗糙度检测模型的均方根误差分别降低了 0。140和0。202 μm,平均绝对误差分别降低了 0。116和0。146 μm,表明图像增强能有效提升低照度条件下基于视觉的粗糙度检测方法的精度。

    表面粗糙度图像增强Retinex理论光照校正图像融合

    基于改进薄板样条运动模型的人脸动画算法

    杨硕王一丁
    255-265页
    查看更多>>摘要:面部动画在电影、游戏、虚拟现实等领域起着关键作用,对于实现逼真、生动的人脸动画和情感传达至关重要。当面临面部形状、姿态、表情等多个变化因素时,虽然通过薄板样条非线性变换可以获得较好的运动估计结果,但在处理面部复杂纹理和嘴部运动时存在运动估计不精细的问题,需要更强大的图像修复能力。因此,提出一种基于改进薄板样条运动模型(TPSMM)的人脸动画算法。首先,在TPSMM的基础上引入一种Farneback光流金字塔算法,通过与薄板样条变换和背景仿射变换相结合,使得人脸局部运动估计更精准;其次,为了更真实地恢复缺失区域的细节纹理信息,提出一种多尺度细节感知网络,该网络在编码器中通过嵌入通道注意力(ECA)模块减少源图像因多层下采样而导致的人脸细节信息丢失,在解码器中利用坐标注意力(CA)模块来有效捕获运动估计特征图中不同位置的重要特征,提高人脸图像的生成质量。实验结果表明,相比一阶段运动模型(FOMM)、关节动画的运动表示法(MRAA)、TPSMM等,该算法在MUG、UvA-Nemo和Oulu-CASIA数据集上的L1、平均关键点距离(AKD)、平均欧氏距离(AED)数值均达到最优,平均分别为0。012 9、0。923、0。000 99。

    面部动画光流估计薄板样条多尺度特征融合通道注意力机制坐标注意力机制

    基于PD-NOMA的人员监控图像传输算法

    吴凡徐朝农邹英豪
    266-275页
    查看更多>>摘要:危险区域人员监控具有摄像节点密度高、传输实时性和图像质量要求高的特点。功率域非正交多址接入(PD-NOMA)技术可以支持多路并行传输,有利于在密集传输场景下提升传输实时性,而多摄像节点协同有利于提高图像质量。在面向危险区域人员监控的PD-NOMA摄像网络中,提出通过多图融合的人员监控图像传输算法,以实现高质量监控。首先,定义了图像的"单人信息量"这一关键术语,它反映了图像中单个人员被准确识别的概率;其次,基于摄像节点之间的位置关系定义了多摄像节点拍摄到的单个人员的融合图像信息量;最后,在满足传输实时性要求以及图像中所有人员均可识别的前提下,以最大化融合图像信息量为目标,计算以摄像节点的图像分辨率和无线发射功率为控制变量的实时传输调度方案。实验结果表明,当实时传输上限为0。4 s时,基于PD-NOMA的传输调度方案传输信息量比传统传输方案提高了 46。4%,使得图像中人员识别概率从0。854 9提升至0。891 9。

    功率域非正交多址接入人员监控传输实时性图像信息量图像融合

    改进邻域漂移的多假设检验点云降噪

    时志鹏冯肖维赵一平
    276-286页
    查看更多>>摘要:在获得三维点云数据时,由于仪器、环境、算法等原因,不可避免地会使获得的点云数据带有噪声,而点云数据所携带的噪声将影响后续的点云处理效果。为了抑制三维点云数据中的噪声,同时保留其不同程度的特征,提出一种改进邻域漂移的多假设点云降噪方法。首先,利用邻域点和法向双张量投票法进行特征描述;接着,利用非参数估计构建转移概率函数,并使用核回归方法对新的采样点进行权重计算,在此基础上运用粒子滤波实现邻域漂移,经过多次迭代得到非局部邻域;然后,通过多假设检验法确定不同特征点处的多个法向,并通过加权平均获得最终法向;最后,采用多假设检验的方法分别对特征点和非特征点进行滤波,产生多个候选点并使用目标函数进行优化,从而对点云模型进行降噪。利用所提方法与RIMLS、EAR、L1、PointNet方法对相同噪声模型进行恢复,并对恢复模型与原模型进行误差分析,结果表明,所提方法的平均降噪精度相比RIMLS、EAR和L1方法分别提高了 38。1%、41。3%和12。4%,与PointNet相比约降低2。9%,但是所提方法无须进行数据库训练且可调参。

    点云降噪张量投票邻域漂移非参数估计核回归多假设检验

    基于边缘计算的轻量化识别方法

    李致金汤佳辉闫金凤
    287-295页
    查看更多>>摘要:"新零售"模式的出现,对传统零售业的转型以及提升用户消费体验具有重要意义。然而,目前市场上的无人水果秤大多存在一些问题,如识别率低、模型结构复杂、部署困难、模型推理实时性差等。针对这些问题,提出一种基于边缘计算的轻量化识别方法。选用MobileNext作为主干网络,引入轻量型的注意力模块CBAM改进MobileNext中的SandGlass模块。利用Ghost模块替换SandGlass模块中的标准1×1卷积,以压缩模型的参数量和运算量。在此基础上,使用迁移学习的策略搭配NAdam优化器训练改进后的MobileNext模型,进一步提高模型的识别精度。在Fruit Recognition数据集上的实验结果表明,该方法在水果识别任务中达到了 98。95%的识别准确率,优于原MobileNext、MobileNetV2和EfficientNet-B0等轻量级模型。相较于原MobileNext模型,改进后的MobileNext模型识别准确率提高了 1。17个百分点,参数量仅为1。775 × 106,推理时间仅为16。5 ms。在实际的零售场景中,所提方法只需很小的参数量和运算量就能实现较好的识别效果,并能够部署在边缘设备上。

    深度学习注意力模块轻量级模型迁移学习边缘设备

    基于改进SwiftNet的堆场图像实时分割网络

    陈晓玉沈晨沈阅孔德明...
    296-303页
    查看更多>>摘要:在堆场环境下,实时图像语义分割可以提供直观的场景类别信息。为节约工控机等边缘设备的硬件资源以及为多源信息融合提供图像语义类别信息,提出一种轻量化的实时语义分割网络模型。首先提出基于空间注意力引导的上采样融合模块,通过引入空间注意力和残差注意力结构设计一种轻量化的解码器,在上采样过程中还原空间细节,抑制冗余信息,进而融合不同来源的特征图;其次提出一种轻量化的级联空洞空间金字塔模块,利用级联的空洞卷积单元增大网络感受野,有效提取多尺度特征;最后使用通道分离、通道混洗、通道池化等操作,降低多尺度聚合过程中的计算开销。在公开数据集Camvid上,该模型的平均交并比(MIoU)为70。1%,推理速度为146。3帧/s,分割精度和推理速度优于ENet、ICNet等模型,消融实验结果也证明了所提各模块的有效性;在实际堆场图像数据集上,该模型的MIoU为93。5%,推理速度为123。8帧/s,证明模型结构具有良好的泛化性能。

    实时语义分割注意力机制空洞卷积感受野堆场图像

    基于信息检索的源代码自动命名

    李雪王雅文张前进
    304-310页
    查看更多>>摘要:源代码自动命名是指为给定代码的方法体命名一个反映代码功能的有意义的名称,可以使代码易读易懂,提高软件开发效率。传统自动命名方法仅使用代码的词法或者语法等单一信息,基于深度学习的自动命名方法通常忽略了语料库中的相似代码,影响命名准确率。针对上述问题,提出一种基于信息检索的源代码自动命名方法。首先,利用预训练模型和BERT-whitening方法提取输入代码和语料库中代码的有效特征,使用欧氏距离计算两者之间的语义相似度。其次,在语料库代码中选择与输入代码语义相似度较高的代码组成候选库,利用Jaccard系数和最长公共子序列分别计算输入代码与候选库代码的词法和语法相似度。最后,使用加权和来匹配候选库中与输入代码最相似的代码片段,复用该代码片段的方法名称作为输入代码的方法名称。实验结果表明,在公开的Java-small数据集上,与基于向量空间模型(VSM)和基于深度学习模型Code2Vec的自动命名方法相比,该方法的F1值分别提升了 6。93和1。22个百分点,具有较优的预测性能。

    自动命名信息检索深度学习BERT-whitening方法语义相似度

    数联网标识解析系统中的标识数据布局策略

    周春雷宋继勐沈子奇余晗...
    311-320页
    查看更多>>摘要:数联网是为解决目前互联网数据资源共享交互过程中传输效率低、协调成本高、安全管控难等缺陷而提出的一种新型信息基础设施。标识解析系统是实现数据流通的关键,但随着标识注册量和解析量的迅速增长,解析节点正面临着大量高并发解析请求,服务质量将变得难以保证。针对该问题,考虑数联网标识解析系统中节点架构的特点,以降低解析时延为目标,提出一种基于遗传算法的自适应离散粒子群优化算法(DPSO-GA)来对标识进行合理布局。该方法综合考虑节点之间的带宽、标识数量和节点容量等因素对解析时延的影响,引入遗传算法的交叉操作和变异操作,对粒子群优化算法的惯性权重因子采取自适应策略,对学习因子采取线性增减的策略。实验结果表明,相较于传统粒子群优化算法及遗传算法,该算法优化效果分别提升了 48。9%和19。9%,增加了种群进化的多样性及搜索范围,减少了算法的时间复杂度以及陷入局部最优解的可能性,且能较稳定地降低标识解析时延。

    数联网标识解析数据布局启发式算法遗传算法粒子群优化算法