首页期刊导航|计算机工程
期刊信息/Journal information
计算机工程
华东计算技术研究所 上海市计算机学会
计算机工程

华东计算技术研究所 上海市计算机学会

游小明

月刊

1000-3428

hdsce@sohu265359.sohuvip.net

021-54972331

200233

上海市桂林路418号

计算机工程/Journal Computer EngineeringCSCD北大核心CSTPCD
查看更多>>本刊是中国电子科技集团公司第三十二研究所(华东计算技术研究所)主办的学术性刊物,是上海市计算机学会会刊。主要特点:以最快的速度、科学求实的精神,精选刊登代表计算机行业前沿科研、技术、工程方面的高、精、尖优秀论文。贯彻党的“双百”方针,繁荣科技创作,促进国内外学术交流,探讨和传播计算机科学的理论和实践,加速和促进我国计算机事业的发展。
正式出版
收录年代

    联邦学习及其安全与隐私保护研究综述

    熊世强何道敬王振东杜润萌...
    1-15页
    查看更多>>摘要:联邦学习(FL)是一种新兴的分布式机器学习技术,只需将数据留在本地即可通过各方协作训练一个共有模型,解决了传统机器学习中数据难以采集和隐私安全的问题。随着联邦学习技术的应用和发展,相关研究发现联邦学习仍可能受到各类攻击。为了确保联邦学习的安全性,研究联邦学习中的攻击方式及相应的隐私保护技术显得尤为重要。首先介绍了联邦学习的背景知识及相关定义,总结概括了联邦学习的发展历程及分类;接着阐述了联邦学习的安全三要素,从基于安全来源和基于安全三要素2个角度分类概述了联邦学习中的安全问题及研究进展;然后对隐私保护技术进行分类,结合相关研究应用综述了联邦学习中安全多方计算(SMC)、同态加密(HE)、差分隐私(DP)、可信执行环境(TEE)4种常用隐私保护技术;最后对联邦学习的未来研究方向进行展望。

    联邦学习数据安全攻击方式隐私保护安全三要素

    基于知识图谱的GitHub层次化学习和检索服务

    江惠珍孙艳春黄罡
    16-25页
    查看更多>>摘要:GitHub是全球最大的在线代码托管平台,为软件开发学习者提供了丰富的学习资源,然而面对丰富而繁杂的GitHub内容,软件开发初学者在使用GitHub的搜索功能搜索所需的学习资源时,由于需求不明确或缺乏相关知识和经验,常会遇到难以构建合适的搜索文本进行有效搜索的问题。针对该问题,利用GitHub主题潜在的层次结构,结合Wikipedia软件开发领域知识,设计GitHub软件开发领域知识图谱,在此基础上提出一种基于知识图谱的GitHub层次化学习和检索服务。通过对比实验和调查问卷的方式验证了提出的层次化学习和检索服务的可行性和有效性。

    GitHub平台维基百科知识图谱层次化学习检索服务

    基于漫反射的被动非视域成像

    吴翠翠王维东
    26-32页
    查看更多>>摘要:非视域(NLOS)成像是一种综合成像和计算重构的技术,指在不直接拍摄场景的情况下通过获取介质上隐藏场景的散射或反射信息对其进行重建。目前的NLOS成像还处于早期发展阶段,场景模型、目标信息重建等尚无系统研究方法。为此,提出一种针对无遮挡、非自发光场景的NLOS成像方法。基于光辐射理论,分析该场景下漫反射面的成像与隐藏物体形状的关系,确定NLOS成像模型与重建目标。使用渲染软件结合运动图像专家组7(MPEG7)数据集,生成符合实际物理意义的漫反射被动非视域全影(DS-NLOS)数据集。构建被动非视域重建网络模型(Re-NLOS),采用视觉Transformer(ViT)结构结合生成式对抗网络(GAN)提取采集的漫反射面图像的全局特征,并恢复隐藏物体形状。在DS-NLOS数据集上的实验结果表明,该方法能够从漫反射面上恢复隐藏物体的形状信息,在测试集20个类别的物体上的峰值信噪比(PSNR)和结构相似性(SSIM)相比漫反射面全影图像平均提高了 5。85 dB和0。038 1,对真实室内场景也具有一定的恢复能力。

    被动非视域成像漫反射全影图像生成式对抗网络亮度传输

    便笺式存储器中一种新颖的交错映射数据布局

    曾灵灵张敦博沈立窦强...
    33-40页
    查看更多>>摘要:现代计算机一直沿用传统的线性数据布局模式,该模式允许对使用行主序模式存储的二维矩阵进行高效的行优先数据访问,但是增加了高效执行列优先数据访问的复杂性,造成列优先访问的空间局部性较差。改善列优先数据访存效率的常见解决方案是对原始矩阵进行预先转置操作,将列优先访问的复杂性集中在一次矩阵转置运算中,然而矩阵转置不仅会引入额外的数据传输操作,而且会消耗额外的存储空间用于存储转置后的矩阵。为了在不引入额外开销的情况下使行优先与列优先数据访问具有同样高效的访存效率,提出一种新颖的交错映射(IM)数据布局,同时在不改变便笺式存储器(SPM)内部结构的基础上,在SPM的输入和输出(I/O)接口处添加循环移位单元和译码单元2个新组件,实现交错映射数据布局并定制访存指令,使程序员可通过定制的访存指令充分利用该数据布局。实验结果表明,应用交错映射数据布局的SPM在仅额外增加了 1。73%面积开销的情况下获得了 1。4倍的加速。

    矩阵转置单指令多数据便笺式存储器数据布局静态随机存储器

    基于MacBERT与对抗训练的机器阅读理解模型

    周昭辰方清茂吴晓红胡平...
    41-50页
    查看更多>>摘要:机器阅读理解旨在让机器像人类一样理解自然语言文本,并据此进行问答任务。近年来,随着深度学习和大规模数据集的发展,机器阅读理解引起了广泛关注,但是在实际应用中输入的问题通常包含各种噪声和干扰,这些噪声和干扰会影响模型的预测结果。为了提高模型的泛化能力和鲁棒性,提出一种基于掩码校正的来自Transformer的双向编码器表示(MacBERT)与对抗训练(AT)的机器阅读理解模型。首先利用MacBERT对输入的问题和文本进行词嵌入转化为向量表示;然后根据原始样本反向传播的梯度变化在原始词向量上添加微小扰动生成对抗样本;最后将原始样本和对抗样本输入双向长短期记忆(BiLSTM)网络进一步提取文本的上下文特征,输出预测答案。实验结果表明,该模型在简体中文数据集CMRC2018上的F1值和精准匹配(EM)值分别较基线模型提高了 1。39和3。85个百分点,在繁体中文数据集DRCD上的F1值和EM值分别较基线模型提高了1。22和1。71个百分点,在英文数据集SQuADv1。1上的F1值和EM值分别较基线模型提高了 2。86和1。85个百分点,优于已有的大部分机器阅读理解模型,并且在真实问答结果上与基线模型进行对比,结果验证了该模型具有更强的鲁棒性和泛化能力,在输入的问题存在噪声的情况下性能更好。

    机器阅读理解对抗训练预训练模型掩码校正的来自Transformer的双向编码器表示双向长短期记忆网络

    基于多样性与一致性的单步多视图聚类

    胡傲然陈晓红
    51-61页
    查看更多>>摘要:随着数据采集技术的发展,多视图数据变得越来越常见。与单视图数据相比,多视图数据包含更丰富的信息,通常用一致性与多样性来刻画。现有基于图的多视图聚类方法大多只关注视图间的一致性信息,忽视了视图间的多样性信息,并且图的构建与聚类过程分离,从而影响聚类算法的效果。提出基于多样性与一致性的单步多视图聚类算法(OMCDC)。基于"距离较近的数据点成为邻居的可能性较大"这一先验知识构建各个视图的相似性图。不同于以往算法直接融合相似性图获得公共图,OMCDC将每个视图的相似性图分解为一致性图和多样性图,通过融合一致性图获得更具一致性的公共图。在此基础上,引入谱旋转,联合优化低维谱嵌入和聚类概率矩阵,将图学习和聚类融为一体,直接获得聚类结果。OMCDC充分利用了多视图数据的一致性信息与多样性信息,结合谱旋转实现了单步多视图聚类。实验结果表明,该算法在100L和HW2数据集上的聚类准确率分别为94。62%和99。30%,相比MVGL、AWP、MCGC等方法具有较优的聚类性能。

    多视图学习多视图聚类谱聚类谱旋转一致性多样性

    基于图神经网络的多智能体强化学习值函数分解方法

    孙文洁李宗民孙浩淼
    62-70页
    查看更多>>摘要:如何在部分可观测的情况下实现智能体之间的协同配合是多智能体强化学习(MARL)中的一个重要问题。值函数分解方法解决了信用分配问题,是一种实现多智能体之间协同配合的有效方法,然而在现有的值函数分解方法中,智能体个体动作值函数仅取决于局部信息,不允许智能体之间进行显式的信息交换,阻碍了这一系列算法的性能,使其无法适用于复杂场景。为了解决这一问题,在值函数分解方法中引入智能体间的通信,为智能体提供有效的非局部信息以帮助其理解复杂环境。在此基础上,提出一个基于图神经网络的分层通信模型,通过图神经网络提取相邻智能体之间需要交换的有用信息,同时模型能够实现从非通信向充分通信过渡,在通信范围有限的情况下实现全局合作,适用于现实世界中通信范围受约束的情况。在星际争霸Ⅱ多智能体挑战赛(SMAC)环境和捕食者-猎物(PP)环境下进行实验,结果表明,在SMAC的4个不同场景下,该方法与QMIX、VBC等基线算法相比平均胜率提升2~40个百分点,并且能够有效解决非单调环境下的捕食者-猎物问题。

    深度强化学习多智能体环境智能体协同智能体通信图神经网络

    融合GPU的拟单层覆盖近似集计算方法

    吴正江吕成功王梦松
    71-82页
    查看更多>>摘要:拟单层覆盖粗糙集是一种匹配集值信息系统且有高质量和高效率的粗糙集模型。拟单层覆盖近似集的计算过程中存在大量计算密集且逻辑简单的运算,为此,提出拟单层覆盖近似集的矩阵化表示方法,以利用图形处理器(GPU)强大的计算性能加速计算过程。为了实现这一目标,使用布尔矩阵表示拟单层覆盖近似空间中的元素,引入与集合运算对应的布尔矩阵算子,提出拟单层覆盖粗糙近似集(DE、DA、DE0与DA0)的矩阵表示,并设计矩阵化拟单层覆盖近似集算法(M_SMC)。同时,相应的定理证明了拟单层覆盖近似集的矩阵表示形式与原始定义的等价性。然而,M_SMC运行过程中出现了矩阵存储和计算步骤的内存消耗过多问题。为了将算法部署到显存有限的GPU上,优化矩阵存储和计算步骤,提出分批处理的矩阵化拟单层覆盖近似集算法(BM_SMC)。在10个数据集上的实验结果表明,融合GPU的BM_SMC算法与单纯使用中央处理器(CPU)的BM_SMC算法相比计算效率提高2。16~11。3倍,BM_SMC算法可以在有限的存储空间条件下充分利用GPU,能够有效地提高拟单层覆盖近似集的计算效率。

    拟单层覆盖近似集集值信息系统矩阵化GPU加速分批处理

    基于多粒度图与注意力机制的半监督短文本分类

    游奔李晓红姚锦冯绍杰...
    83-90页
    查看更多>>摘要:短文本语义稀疏模糊、蕴含信息不足、表达不规则等缺陷给短文本分类任务带来了极大的挑战,且现有短文本分类方法通常忽略词项间的交互信息,不能充分挖掘隐含的语义信息,导致分类效率低下。针对上述问题,提出一种基于多粒度图与注意力机制的半监督短文本分类模型MgGAt。该模型在词粒度和文本粒度基础上构建2种类型的图,通过充分挖掘语义信息完成分类任务。首先构建词级图,捕获词嵌入,进而学习得到文本特征表示。在词级图上引入跳内注意力和跳间注意力,从多种语义角度有效提取词项间隐含的高阶信息,捕获语义丰富的词嵌入。同时依据词级子图的特点设计池化策略,聚合词嵌入,学习文本表征。其次构建文本级图,借助部分已知的标签信息,利用图神经网络的优势,在图上执行标签传播和推理,完成半监督短文本分类任务。在4个公开数据集上的实验结果表明,与基线模型相比,MgGAt模型的短文本分类精确率平均提升了 1。18个百分点,F1值平均提升了 1。37个百分点,具有更好的分类性能。

    短文本分类半监督分类图神经网络注意力机制多粒度图

    基于深度强化学习的无信号灯路口决策研究

    傅明建郭福强
    91-99页
    查看更多>>摘要:无信号灯左转路口是自动驾驶场景中最为危险的场景之一,如何实现高效安全的左转决策是自动驾驶领域的重大难题。深度强化学习(DRL)算法在自动驾驶决策领域具有广阔应用前景。但是,深度强化学习在自动驾驶场景中存在样本效率低、奖励函数设计困难等问题。提出一种基于专家先验的深度强化学习算法(CBAM-BC SAC)来解决上述问题。首先,利用SMARTS仿真平台获得专家先验知识;然后,使用通道-空间注意力机制(CBAM)改进行为克隆(BC)方法,在专家先验知识的基础上预训练模仿专家策略;最后,使用模仿专家策略指导深度强化学习算法的学习过程,并在无信号灯路口左转决策中进行验证。实验结果表明,基于专家先验的DRL算法比传统的DRL算法更具优势,不仅可以免去人为设置奖励函数的工作量,而且可以显著提高样本效率从而获得更优性能。在无信号灯路口左转场景下,CBAM-BC SAC算法与传统DRL算法(SAC)、基于传统行为克隆的DRL算法(BC SAC)相比,平均通行成功率分别提高了 14。2和2。2个百分点。

    深度强化学习自动驾驶模仿学习行为克隆驾驶决策