首页期刊导航|计算机工程与科学
期刊信息/Journal information
计算机工程与科学
国防科学技术大学计算机学院
计算机工程与科学

国防科学技术大学计算机学院

王志英

月刊

1007-130X

jsjgcykx@163.net

0731-84576405

410073

湖南省长沙市开福区德雅路109号国防科技大学计算机学院

计算机工程与科学/Journal Computer Engineering and ScienceCSCD北大核心CSTPCD
查看更多>>本刊系国防科技大学计算机学院主办的计算机类综合性学术刊物,属中国计算机学会会刊,已先后被列为中文核心期刊、中国科技核心期刊、中国学术期刊(光盘版)全文入编期刊、中国科学引文数据库来源期刊(CSCD核心)、中国学术期刊综合评价数据库来源期刊。
正式出版
收录年代

    GNNSched:面向GPU的图神经网络推理任务调度框架

    孙庆骁刘轶杨海龙王一晴...
    1-11页
    查看更多>>摘要:由于频繁的显存访问,图神经网络GNN在GPU上运行时往往资源利用率较低。现有的推理框架由于没有考虑GNN输入的不规则性,直接适用到GNN进行推理任务共置时可能会超出显存容量导致任务失败。对于GNN推理任务,需要根据其输入特点预先分析并发任务的显存占用情况,以确保并发任务在GPU上的成功共置。此外,多租户场景提交的推理任务亟需灵活的调度策略,以满足并发推理任务的服务质量要求。为了解决上述问题,提出了 GNNSched,其在GPU上高效管理GNN推理任务的共置运行。具体来说,GNNSched将并发推理任务组织为队列,并在算子粒度上根据成本函数估算每个任务的显存占用情况。GNNSched实现了多种调度策略来生成任务组,这些任务组被迭代地提交到GPU并发执行。实验结果表明,GNNSched能够满足并发GNN推理任务的服务质量并降低推理任务的响应时延。

    图神经网络图形处理器推理框架任务调度估计模型

    基于异构平台的卷积神经网络加速系统设计

    秦文强吴仲城张俊李芳...
    12-20页
    查看更多>>摘要:在计算和存储资源受限的嵌入式设备上部署卷积神经网络,存在执行速度慢、计算效率低、功耗高的问题。提出了一种基于异构平台的新型卷积神经网络加速架构,设计并实现了基于MobileNet的轻量化卷积神经网络加速系统。首先,为降低硬件资源消耗以及数据传输成本,采用动态定点数量化和批标准化融合的设计方法,对网络模型进行了优化,并降低了加速系统的硬件设计复杂度;其次,通过实现卷积分块、并行卷积计算、数据流优化,有效提高了卷积运算效率和系统吞吐率。在PYNQ-Z2平台上的实验结果表明,此加速系统实现的MobileNet网络推理加速方案对单幅图像的识别时间为0。18 s,系统功耗为2。62 W,相较于ARM单核处理器加速效果提升了 128倍。

    现场可编程门阵列(FPGA)Vivado高层次综合卷积神经网络异构平台硬件加速

    基于内存保护键值的细粒度访存监控

    王睿伯吴振伟张文喆邬会军...
    21-27页
    查看更多>>摘要:基于内存保护键值硬件扩展,提出了一种轻量化且细粒度的页保护机制。突破了传统页保护方法仅支持页粒度访存监控的技术局限,实现了能够拦截每个访存操作的细粒度页保护机制。充分利用内存保护键值提供的用户态线程局部页访问权限控制,性能开销相比传统页保护的降低了 30%以上。通过融合细粒度页保护与编译插桩,弥补了传统编译插桩方法无法覆盖程序中不可重编译部分的局限性。

    访存监控内存保护键值页保护编译插桩

    Gloo+:利用在网计算技术加速分布式深度学习训练

    黄泽彪董德尊齐星云
    28-36页
    查看更多>>摘要:在分布式深度学习训练中,聚合通信是主要的通信方式。在聚合通信优化的研究中,有软件层面的优化和硬件层面的优化。SH ARP是Mellanox提出来的一种聚合通信网络卸载协议,是针对聚合通信在硬件上的优化,其将聚合操作卸载到网络中的交换机,进而缩短了聚合通信时间。在Gloo的基础上集成了SHARP技术,设计并实现了一个能够利用在网计算技术来加速分布式深度学习训练的聚合通信库——Gloo+。评估并比较了 Gloo+、Gloo以及MPI中聚合操作的性能,并将Gloo+应用于分布式深度学习训练中,以此来检验其实战能力。对Gloo+的实验评估结果显示,在基准测试时,在消息大小较小的情况下,Gloo+相对于Gloo的加速比最高能达到100以上;相比于以太网模式下的MPI,其加速比最高也能达到50以上;相比于IB网模式下的MPI,其加速比在10以内。在分布式深度学习训练的实际应用中,Gloo+相比于Gloo加速比最高能达到1。1,相比于以太网模式下的MPI加速比最高有1。3,相比于IB网模式下的MPI加速比最高有0。5。

    分布式深度学习聚合通信在网计算GlooSHARP

    一种基于C单元的三节点翻转自恢复锁存器

    徐辉朱烁孙皓洁马瑞君...
    37-45页
    查看更多>>摘要:随着集成电路中工艺尺寸的不断缩减,锁存器也越来越容易受到粒子辐射引起的三节点翻转的影响。针对该问题,基于C单元的结构,提出一种低功耗、低延时和高鲁棒性的三节点翻转并自恢复的MKEEP锁存器。通过仿真实验和PVT的波动实验表明,相对于其他拥有三节点容忍或自恢复能力的锁存器,该锁存器拥有低功耗、低延迟和更小的面积开销,且对工艺、电压和温度的敏感度较低,优势明显。

    粒子辐射三节点翻转锁存器自恢复

    区块链安全问题研究综述

    沈传年
    46-62页
    查看更多>>摘要:区块链凭借其颠覆性的创新技术,正在不断改变数字金融、数字政务、物联网、智能制造等诸多行业的运行规则和应用场景,是构建未来社会全新信任体系和价值体系不可或缺的关键技术。然而,区块链自身技术的缺陷和应用场景的复杂多变导致的安全问题日趋严重,已成为制约区块链未来发展的主要瓶颈,区块链的监管之路任重道远。介绍了区块链的背景知识、基本概念和体系架构;从区块链的体系架构出发,分别从数据层、网络层、共识层、激励层、合约层、应用层以及跨链7个方面对区块链的安全问题和防范策略进行分析;在此基础上,从当前政策监管的情况及监管难点、技术监管的标准建立、创新方式及发展趋势对区块链的安全监管进行探讨。

    区块链共识机制智能合约跨链监管

    基于智能进化算法的可见水印对抗攻击

    季俊豪张玉书赵若宇温文媖...
    63-71页
    查看更多>>摘要:随着公民版权意识的提高,越来越多含有水印的图像出现在生活中。然而,现有的研究表明,含有水印的图像会导致神经网络分类错误,这对神经网络的普及和应用构成了巨大的威胁。对抗训练是解决这类问题的防御方法之一,但是需要使用大量的水印对抗样本作为训练数据。为此,提出了一种基于智能进化算法的可见水印对抗攻击方法来生成高强度的水印对抗样本。该方法不仅能快速生成水印对抗样本,而且还能使其最大程度地攻击神经网络。此外,该方法还加入了图像质量评价指标来约束图像的视觉损失,从而使水印对抗样本更加美观。实验结果表明,所提方法相比于基准水印攻击方法时间复杂度更低,相比于基准黑盒攻击对神经网络攻击成功率更高。

    对抗攻击水印图像质量评价指标优化神经网络

    DNA存储场景下的大小喷泉码模型设计

    崔竞松蒋昌跃郭迟
    72-82页
    查看更多>>摘要:在DNA存储等应用场景中,传统喷泉码算法需要占用额外信道资源将源文件分组数目K传递给解码端。在实际应用中,虽然可以将K嵌入在每一个编码数据分组中进行传递,但这种做法会严重浪费信道的带宽。针对上述问题,提出了 一种大小喷泉码模型,通过增加小喷泉码这一带外信道来优化关键参数的传递。小喷泉码将每个编码分组中有关参数K所占用空间的粒度降至1 bit,有效减少了带宽资源的消耗。此外,小喷泉码还能适应由于DNA存储介质不均匀所导致的编码序列不定长的限制条件,一定条件下甚至可以完全不占用额外信道带宽。

    DNA存储喷泉码LT码规避序列

    智能车载网络中匿名认证与密钥交换协议

    张晓均唐浩宇付红王文琛...
    83-90页
    查看更多>>摘要:智能车载网络是实现智能交通系统的核心,近年来受到学术界越来越多的关注,但车载网络固有的开放性、脆弱性导致其面临许多安全问题。为解决智能车辆与附近RSU之间双向认证和会话密钥的交换以及智能车辆的身份匿名性问题,提出智能车载网络中匿名认证与密钥交换协议。协议中设计了基于身份的数字签名算法,使得智能车辆以身份完全匿名的方式向附近的路边基站单元发送认证信息。当路边基站单元通过认证之后,计算一个消息认证码作为响应信息发送给请求认证的智能车辆,以实现双向认证。此外,在匿名认证的同时还能进行会话密钥的协商,用于后续的安全保密通信。协议是基于身份密码系统设计的,不需要复杂的证书管理。性能评估表明,所提协议能够有效部署在智能车载应用场景。

    智能车载网络身份匿名密钥交换双向认证消息认证码

    《计算机工程与科学》征文通知

    90页