首页期刊导航|计算机工程
期刊信息/Journal information
计算机工程
华东计算技术研究所 上海市计算机学会
计算机工程

华东计算技术研究所 上海市计算机学会

游小明

月刊

1000-3428

hdsce@sohu265359.sohuvip.net

021-54972331

200233

上海市桂林路418号

计算机工程/Journal Computer EngineeringCSCD北大核心CSTPCD
查看更多>>本刊是中国电子科技集团公司第三十二研究所(华东计算技术研究所)主办的学术性刊物,是上海市计算机学会会刊。主要特点:以最快的速度、科学求实的精神,精选刊登代表计算机行业前沿科研、技术、工程方面的高、精、尖优秀论文。贯彻党的“双百”方针,繁荣科技创作,促进国内外学术交流,探讨和传播计算机科学的理论和实践,加速和促进我国计算机事业的发展。
正式出版
收录年代

    基于联邦学习的多技术融合数据交易方法

    刘少杰文斌王泽旭
    182-190页
    查看更多>>摘要:数据保护的约束使得数据被限制在不同企业和组织之间,形成了众多"数据孤岛",难以发挥其蕴含的重要价值。联邦学习的出现使得数据在组织之间共享成为可能,但利益分配方案不明确、通信成本高、中心化等问题使其难以满足数据交易场景的多方位需求。针对这些问题,提出一种基于联邦学习的多技术融合数据交易方法(MTFDT)。通过结合可信执行环境与沙普利值进行激励机制设计,并对交易过程中模型数据同步机制进行优化,提出一种基于树型拓扑结构的模型同步方案,使得同步时间复杂度由线性级降低至对数级。同时,设计基于区块链的利益分配数据和模型数据存储方案,使得交易过程信息不可篡改并能够通过溯源的方式进行追责。基于公开数据集进行仿真对比,实验结果表明,MTFDT能够实现模型训练效果的精确评估,提高利益分配的公平性,相比已有方案,模型同步时间消耗最多减少34%且对带宽要求更低。

    数据交易联邦学习区块链激励机制通信优化

    基于深度监督隐空间构建的语义分割改进方法

    王柏涵姜晓燕范柳伊
    191-199页
    查看更多>>摘要:现有卷积操作在语义分割任务中难以有效捕捉长距离区域间的关系,导致分割结果不符合人类常识。为此,提出一种基于深度监督隐空间构建的语义分割改进方法。采用"特征图-隐空间-特征图"流程,将图像空间的像素特征转换为隐空间中的节点特征,将区域之间的位置和语义关系转换为节点之间的连接权重,实现了从特征图到隐空间的特征转换。在隐空间构建过程中,使用Kullback-Leibler散度损失函数监督投影矩阵,以避免从特征图到隐空间节点的转换过程中丢失特征;使用InfoNCE损失函数监督节点特征表征与真实标签表征,使得图像特征与标签保持一致。该方法在构建的隐空间上使用图神经网络进行语义推理,学习节点之间的关系,赋予模型学习区域间语义关系的能力,从而改善分割结果中的反常识现象。在公开数据集CityScapes上的实验结果表明,相比基线分割网络,该方法的平均交并比(mIoU)为81。1%,相较于基线分割网络mIoU提升2。6个百分点,能有效提升分割结果。

    语义分割卷积神经网络深度监督图神经网络反常识现象

    基于单-多视图优化的足球球员三维姿态和体型估计

    谢欢刘纯平季怡
    200-207页
    查看更多>>摘要:足球比赛场景的三维重建有助于观众自由切换视角,增加了互动性和沉浸感。针对足球比赛场景中的足球球员,提出一种三维姿态和体型估计方法。对球员的多视图图像使用训练好的部分注意力回归的三维人体估计(PARE)模型生成初始的三维姿态和体型估计,并使用人工标注的二维关节点作为优化目标。单-多视图优化操作利用蒙皮多人线性模型(SMPL)和正交投影的可微性,将球员的三维姿态和体型参数映射到二维关节点,计算其与人工标注之间的差异,再使用神经网络的反向传播算法更新三维姿态和体型参数,持续这些过程直到差异最小化。在自建的足球球员多视图数据集上的实验结果表明,该方法能够有效估计足球球员的三维姿态和体型,与人体网格恢复、在循环中优化SMPL、PARE等方法相比,二维关节点精度在单视图上提高了9。2%~37。5%,在多视图交叉验证中提高了34。9%~54。1%。

    三维姿态和体型估计参数化人体模型单-多视图优化反向传播蒙皮多人线性模型

    融合注意力机制的多视图卷积手势识别研究

    袁文涛卫文韬高德民
    208-215页
    查看更多>>摘要:基于表面肌电信号(sEMG)的手势识别在人机交互中发挥着重要作用,然而,由于sEMG具有非线性和随机性,因此提升基于稀疏多通道sEMG的手势识别准确率难度较高。提出一种融合注意力机制的多视图卷积手势识别模型。首先使用200 ms滑动窗口提取经典的sEMG特征集构建多视图输入,其次利用高效通道注意力对多视图特征在通道维度进行加权,以强化有效特征同时弱化无效特征,最后通过多视图卷积从带有注意力权重的肌电特征中提取高层特征,利用高层特征融合模块对其进行融合以降低数据维度并提高模型鲁棒性。在NinaPro DB1、NinaPro DB5、NinaPro DB73个肌电公共数据集上进行训练和评估,结果表明,该模型在200 ms滑动采样窗口上的平均识别准确率分别为 87。98%、94。97%和 89。67%,整段手势动作的平均投票准确率分别为 97。38%、98。41%和97。09%,平均信息传输率为1308。71 bit/min。与传统机器学习方法和近年来前沿的深度学习手势识别方法相比,所提模型在单模态肌电和多模态手势识别上均具有更高的识别准确率,验证了其有效性和通用性。

    表面肌电信号手势识别特征提取注意力机制多视图卷积

    基于多级残差信息蒸馏的真实图像去噪方法

    冯妍舟刘建霞王海翼冯国昊...
    216-223页
    查看更多>>摘要:深度神经网络对真实图像有较强的去噪能力,可以学习含噪图像和干净图像之间复杂的非线性映射关系。然而,过多的卷积操作导致计算成本增加并占据大量内存,限制了去噪技术在低运算能力设备中的应用,现有去噪算法容易损坏细节信息,恢复图像存在边缘过度平滑、纹理缺失、含有残留噪声等问题。针对这些问题,构造一种多级残差信息蒸馏模块。通过对特征通道进行分割,保留部分特征用于后续多级融合,并进一步通过深度提取单元提取细化后的特征信息;引入对比度感知通道注意力机制对不同通道的特征分配权重;使用多级跳跃连接充分融合不同阶段提取到的上下文信息。构建1个轻量级的多级残差信息蒸馏网络,采用块间复杂度低的编码-解码结构,编码部分为含噪图像特征提取模块,解码部分为干净图像恢复模块。为了加快训练速度,采用混合图像尺寸的渐进式训练方法。实验结果表明,该方法在SSID和DND真实图像数据集上的峰值信噪比分别为 39。43 dB和39。49 dB,与其他网络相比提升了0。17~15。77 dB和0。02~7。06 dB,而模型参数量仅为6。92×106,所提模型在提高去噪性能的同时具有较少的参数量。

    图像复原真实图像去噪多级残差信息蒸馏模块深度提取模块对比度感知通道注意力

    基于空间可变形Transformer的三维点云配准方法

    谢帅康熊风光朱新杰宋宁栋...
    224-232页
    查看更多>>摘要:针对低重叠场景下点云配准方法鲁棒性差、配准精度低的问题,提出一种基于空间可变形Transformer(SDT)的三维点云配准方法。设计多级分辨率特征的提取与融合方法,显式计算点云的局部空间关系。利用SDT模块增强点云空间特征的表达能力,聚合局部与全局的特征得到特征矩阵。计算两个特征矩阵的相似度矩阵并额外地为其添加边缘松弛块,有效降低了不可行匹配对配准鲁棒性的影响,同时对相似度矩阵进行归一化等计算得到软对应置信度矩阵,根据预测的对应点空间特征是否一致来寻找点云在低重叠场景下更精确的对应关系,使用直接定义在对应关系上的损失来训练网络,将软对应关系转换为一对一的硬匹配关系,最终通过随机抽样一致性刚性变换求解器执行配准。实验结果表明,在重叠率低于30%的3DLoMatch场景中,该方法的特征匹配召回率和配准召回率相比于高度关注重叠区域的成对点云配准等方法至少提高了3。7和3。9个百分点,并且具有较强的鲁棒性。

    低重叠率多特征融合可变形自注意力边缘松弛块重叠对应预测

    基于深度估计置信度的聚焦形貌恢复

    史艳琼查昭张文亮戴尔愉...
    233-241页
    查看更多>>摘要:聚焦形貌恢复是非接触式三维重建领域中的重要技术手段。由于环境的影响和相机本身的限制,图像采集过程中会不可避免地产生噪声信息,影响重建精度。针对该问题,提出一种高精度、抗噪声的聚焦形貌恢复算法。使用聚焦评价函数对离焦序列图像进行评价,得到聚焦评价序列图像,并使用高斯拟合峰值法定位像素聚焦位置获得初始深度图。在此基础上,通过像素的聚焦评价曲线与灰度曲线之间的相似度衡量深度估计置信度,生成初始深度图的置信图,并将置信图作为引导图对初始深度图进行引导滤波,得到优化后的深度图。使用多组仿真离焦序列图像与真实显微离焦序列图像对所提方法进行性能验证,实验结果表明:所提方法在仿真与真实离焦序列中均能表现出优良的三维重建效果,在真实数据实验中,所提方法的所有指标均优于基于深度图优化的方法,与传统方法相比均方根误差分别降低64。8%和47。3%以上,相关系数分别提高2。18%和6。35%以上,具有更高的精度和更强的抗噪性,能有效提高聚焦形貌恢复精度。

    聚焦形貌恢复三维重建相似度置信度深度图引导滤波

    动态场景下基于语义分割的视觉SLAM方法

    杜晓英袁庆霓齐建友王晨...
    242-249页
    查看更多>>摘要:针对在动态场景下视觉同步定位与建图(SLAM)鲁棒性差、定位与建图精度易受动态物体干扰的问题,设计一种基于改进DeepLabv3plus与多视图几何的语义视觉SLAM算法。以语义分割网络DeepLabv3plus为基础,采用轻量级卷积网络MobileNetV2进行特征提取,并使用深度可分离卷积代替空洞空间金字塔池化模块中的标准卷积,同时引入注意力机制,提出改进的语义分割网络DeepLabv3plus。将改进后的语义分割网络DeepLabv3plus与多视图几何结合,提出动态点检测方法,以提高视觉SLAM在动态场景下的鲁棒性。在此基础上,构建包含语义信息和几何信息的三维语义静态地图。在TUM数据集上的实验结果表明,与ORB-SLAM2相比,该算法在高动态序列下的绝对轨迹误差的均方根误差值和标准差(SD)值最高分别提升98%和97%。

    DeepLabv3plus网络视觉同步定位与建图多视图几何动态场景语义地图

    面向拥挤行人检测的改进YOLOv7算法

    徐芳芯樊嵘马小陆
    250-258页
    查看更多>>摘要:针对拥挤行人检测场景下检测算法容易产生漏检与误检的问题,提出一种改进的YOLOv7拥挤行人检测算法。在骨干网络中引入BiFormer视觉变换器和改进的高效层聚合网络(RC-ELAN)模块,通过自注意力机制与注意力模块使骨干网络更多聚焦于被遮挡行人的重要特征,有效缓解了目标特征缺失对检测造成的负面影响。采用基于双向特征金字塔网络思想的改进颈部网络,通过转置卷积和改进的Rep-ELAN-W模块使模型可以高效利用中低维特征图中的小目标特征信息,有效提升了模型的小目标行人检测性能。引入高效的完全交并比损失函数,使模型可以进一步收敛至更高精度。在含有大量小目标遮挡行人的WiderPerson数据集上的实验结果表明,与YOLOv7、YOLOv5、YOLOX算法相比,改进的YOLOv7算法的交并比阈值分别取0。5和0。5~0。95时的平均精准度提升了2。5和2。8、9。9和7。1、12。3和10。7个百分点,可较好地应用于拥挤行人检测场景。

    机器视觉拥挤行人检测注意力机制YOLO系列算法双向特征金字塔网络

    基于多尺度上下文的英文作文自动评分研究

    于明诚党亚固吴奇林吉旭...
    259-266页
    查看更多>>摘要:目前作文自动评分模型缺乏对不同尺度上下文语义特征的提取,未能从句子级别计算与作文主题关联程度的特征。提出基于多尺度上下文的英文作文自动评分研究方法MSC。采用XLNet英文预训练模型提取原始作文文本单词嵌入和句嵌入,避免在处理长序列文本时无法准确捕捉到符合上下文语境的向量嵌入,提升动态向量语义表征质量,解决一词多义问题,并通过一维卷积模块提取不同尺度的短语级别嵌入。多尺度上下文网络通过结合内置自注意力简单循环单元和全局注意力机制,分别捕捉单词、短语和句子级别的作文高维潜在上下文语义关联关系,利用句向量与作文主题计算语义相似度提取篇章主题层次特征,将所有特征输入融合层通过线性层得到自动评分结果。在公开的标准英文作文评分数据集ASAP上的实验结果表明,MSC模型平均二次加权的Kappa值达到了80。5%,且在多个子集上取得了最佳效果,优于实验对比的深度学习自动评分模型,证明了MSC在英文作文自动评分任务上的有效性。

    英文作文自动评分预训练模型多尺度上下文全局注意力主题层次特征