首页期刊导航|计算机研究与发展
期刊信息/Journal information
计算机研究与发展
计算机研究与发展

徐志伟

月刊

1000-1239

crad@ict.ac.cn

010-62620696;62600350

100190

北京中关村科学院南路6号

计算机研究与发展/Journal Journal of Computer Research and DevelopmentCSCD北大核心CSTPCDEI
查看更多>>本刊是中国科学院计算技术研究所和中国计算机学会联合主办、科学出版社出版的学术性刊物、中国计算机学会会刊,我国第一个计算机刊物。主要刊登计算机科学技术领域高水平的学术论文、最新科研成果和重大应用成果。
正式出版
收录年代

    基于SRAM和NVM的存内计算技术综述

    张章施刚王启帆马永波...
    2937-2951页
    查看更多>>摘要:集存储与计算于一身的快速低功耗存内计算架构,突破了存储与计算分离的传统冯·诺依曼体系,解决了限制处理器算力的"内存墙"问题,成为新型计算架构的研究热点.存内计算的基础器件包括高速且工艺成熟的静态随机存取存储器(static RAM,SRAM)、低功耗高响应且非易失的忆阻器(memristor)、高密度低静态功耗非易失的磁性随机存取存储器(magnetic RAM,MRAM).研究者们基于上述器件完成大量存内计算研究,但是关于这些存内计算架构全面且系统总结的文献综述仍然缺失.首先从SRAM、忆阻器、MRAM方向出发概述了不同器件的存内计算原理、当前存内计算架构发展状况和实际应用场景等.然后针对当前存内计算架构存在的各种问题和挑战给出了现有解决方案和未来解决方向.最后对基于以上器件的存内计算研究重点进行了总结并概述了目前的研究短板、展望未来的发展方向.

    非冯·诺依曼静态随机存取存储器忆阻器磁性随机存取存储器存内计算

    ChipletNP:基于芯粒的敏捷可定制网络处理器架构

    李韬杨惠厉俊男刘汝霖...
    2952-2968页
    查看更多>>摘要:5G,8K视频等新业务类型不断涌现,使得网络处理器(network processor,NP)的应用场景日趋复杂多样.为满足多样化网络应用在性能、灵活性以及服务质量保证等方面的差异化需求,传统NP试图在片上系统(system on chip,SoC)上集成大量处理器核、高速缓存、加速器等异质处理资源,提供面向多样化应用场景的敏捷可定制能力.然而,随着摩尔定律和登纳德缩放定律失效问题的逐渐凸显,单片NP芯片研制在研发周期、成本、创新迭代等方面面临巨大挑战,越来越难以为继.针对上述问题,提出新型敏捷可定制NP架构ChipletNP,基于芯粒化(Chiplet)技术解耦异质资源,在充分利用成熟芯片产品及工艺的基础上,通过多个芯粒组合,满足不同应用场景下NP的快速定制和演化发展需求.基于ChipletNP设计实现了一款集成商用CPU、FPGA(field programmable gate array)和自研敏捷交换芯粒的银河衡芯敏捷NP芯片(YHHX-NP).基于该芯片的应用部署与实验结果表明,ChipletNP可支持NP的快速敏捷定制,能够有效承载SRv6(segment routing over IPv6)等新型网络协议与网络功能部署.其中,核心的敏捷交换芯粒相较于同级商用芯片能效比提升 2倍以上,延迟控制在 2.82µs以内,可以有效支持面向NP的Chiplet统一通信与集成.

    网络处理器芯粒技术敏捷交换分组处理异构资源

    HVMS:基于混合向量化的SpMV优化机制

    颜志远解壁伟包云岗
    2969-2984页
    查看更多>>摘要:在科学计算和系统工程等领域,稀疏矩阵向量乘(sparse matrix-vector multiplication,SpMV)占据着极其重要的位置.受限于矩阵稀疏性所导致的访存不规则性,向量优化一直是SpMV的难点.针对此问题,进行深入分析并且总结影响SpMV向量化效率的主要因素.除却稀疏矩阵内非零元分布的不规则,不同稀疏矩阵之间的非零元分布特征亦有明显不同,导致单一的向量优化策略难以适用于多种不同特征的稀疏矩阵.另一方面,多样化向量硬件在向量特性和指令上的差异,影响了SpMV向量优化方法的通用性.把不规则的稀疏矩阵映射到规则的向量硬件上进行计算,是SpMV向量化面临的最主要挑战.基于此,提出一种基于混合向量化方法的SpMV优化机制(hybrid vectorization-optimized mechanism of SpMV,HVMS).HVMS首先对向量硬件的特性进行抽象建模,并基于抽象出的基本操作,设计相应的规则指导稀疏矩阵进行规则化转换.按照不同的矩阵特征,HVMS将稀疏矩阵划分为不同的部分,弱化稀疏矩阵的不规则程度,并引入不同的优化策略最大化SpMV的向量化效率,从而提升性能.基于Intel Xeon平台,在 30个常用稀疏矩阵上对 HVMS进行实验分析.结果表明,相比现有代表性工作如 CVR,SELL-C-σ,Intel MKL,HVMS分别获得1.60倍、1.72倍和1.93倍的平均加速比.

    稀疏矩阵向量乘向量优化稀疏矩阵SIMD多核系统

    面向深度神经网络大规模分布式数据并行训练的MC2能耗模型

    魏嘉张兴军王龙翔赵明强...
    2985-3004页
    查看更多>>摘要:深度神经网络(deep neural network,DNN)在许多现代人工智能(artificial intelligence,AI)任务中取得了最高的精度.近年来,使用高性能计算平台进行大规模分布式并行训练DNN越来越普遍.能耗模型在设计和优化DNN大规模并行训练和抑制高性能计算平台过量能耗方面起着至关重要的作用.目前,大部分的能耗模型都是从设备的角度出发对单个设备或多个设备构成的集群进行能耗建模,由于缺乏从能耗角度对分布式并行DNN应用进行分解剖析,导致罕有针对分布式DNN应用特征进行建模的能耗模型.针对目前最常用的DNN分布式数据并行训练模式,从DNN模型训练本质特征角度出发,提出了"数据预处理(materials preprocessing)-前向与反向传播(computing)-梯度同步与更新(communicating)"三阶段MC2 能耗模型,并通过在国产E级原型机天河三号上使用最多 128个MT节点和 32个FT节点训练经典的VGG16和ResNet50网络以及最新的Vision Transformer网络验证了模型的有效性和可靠性.实验结果表明,MC2 与真实能耗测量结果相差仅为 2.84%,相较 4种线性比例能耗模型以及 AR,SES,ARIMA时间预测模型准确率分别提升了69.12个百分点,69.50个百分点,34.58个百分点,13.47个百分点,5.23个百分点,22.13个百分点,10.53个百分点.通过使用的模型可以在超算平台得到DNN模型的各阶段能耗和总体能耗结果,为评估基于能耗感知的DNN大规模分布式数据并行训练及推理各阶段任务调度、作业放置、模型分割、模型裁剪等优化策略的效能提供了基础.

    深度神经网络能耗模型大规模分布式训练数据并行超级计算机

    Web3.0数字经济风险感知技术综述

    贾金萍肖诗涵钱堃杨艳琴...
    3005-3026页
    查看更多>>摘要:Web 3.0数字经济体系以区块链平台为基础设施,围绕加密货币、NFT、数字藏品等数字资产和去中心化金融(DeFi)、游戏金融(GameFi)等去中心化应用(DApp)开展各项社会经济活动.在公有链和开放联盟链下,作为DApp内核的智能合约可以由任何个人或组织予以部署,并对全体用户可见及可调用.这种开放性给经济发展带来了新的机遇,同时也蕴含了许多金融风险.以智能合约为中心分析了Web 3.0数字经济潜在的风险,并从智能合约的编码、功能、应用 3个层面总结了风险感知技术的研究现状.首先介绍了智能合约漏洞检测技术的研究挑战、安全漏洞类型和 4类漏洞检测方法;其次分析了常见的智能合约骗局类型,并根据训练数据的不同分类总结了现有的智能合约骗局识别技术;接着介绍了基于区块链交易记录对 4种非法交易行为进行检测的技术现状;最后结合对现有工作局限性的分析,展望了未来的研究方向.

    Web3.0区块链智能合约风险感知技术数字经济

    WebAssembly安全综述

    庄骏杰胡霜华保健汪炀...
    3027-3053页
    查看更多>>摘要:WebAssembly是一种新兴的二进制指令集体系结构与代码分发格式,旨在为高级程序语言提供统一且架构无关的编译目标.由于其安全、高效与可移植等先进特性,WebAssembly在Web领域与非Web领域均得到了广泛应用,正在成为最有前景的跨平台公共语言标准之一.尽管WebAssembly提供了多种先进特性以保证安全性,然而,已有研究表明,WebAssembly仍然存在特有的攻击面从而导致安全问题,这些安全问题直接影响到基于WebAssembly的整个软件系统生态.因此,对WebAssembly安全问题的产生机理、现有解决方案以及亟待解决的科学问题展开系统研究尤为重要.基于WebAssembly安全研究领域已经公开发表的 42篇研究论文,对WebAssembly安全的相关研究进行了系统研究、分析、归纳和总结:首先,研究分析了WebAssembly的核心安全特性,并在此基础上首次提出了WebAssembly的 4层安全威胁模型,包括高级语言支持、编译工具链、二进制表示和语言虚拟机,并对每一层的安全威胁和攻击面进行了详细讨论;其次,提出了WebAssembly安全研究的分类学,将已有研究划分为安全实证研究、漏洞检测与利用、安全增强、形式语义与程序验证 4个热点研究方向,并对这 4个方向分别进行了综述、分析和总结;最后,指出了该领域待解决的科学问题,并展望了5个潜在的研究方向.

    WebAssembly语言安全漏洞检测与利用安全增强形式化验证

    实时多媒体传输延迟优化:架构、进展与展望

    孟子立徐明伟
    3054-3068页
    查看更多>>摘要:实时多媒体传输是互联网最重要的应用之一,其系统对于传输延迟提出了很高的需求.其中,延迟波动是延迟优化中最具有挑战性的问题.然而,传统的尽力而为的传输服务在很多情况下无法满足实时多媒体传输对延迟波动的要求.首先,阐述了实时多媒体传输面临的主要挑战.其次,分析了如果要优化实时多媒体传输的延迟亟需解决的关键问题.基于上述问题归纳了实时多媒体传输系统架构中的 2个关键通路、5个核心组件.围绕各个组件涉及的技术,梳理了代表性研究成果.在此基础上,总结了面向实时多媒体传输及低延迟应用的研究分支,并对各研究分支优化算法与应用进行综述.通过分析发现,延迟的尾部波动是实时多媒体延迟优化应关注的主要目标.最后,提出了未来可能的研究方向.

    实时多媒体传输延迟波动实时性网络体系结构低延迟传输

    全同态加密研究进展

    白利芳祝跃飞李勇军王帅...
    3069-3087页
    查看更多>>摘要:随着数字化进程的加速推进,数据安全和隐私保护问题备受关注.数据加密一直是解决该问题的重要手段,但加密存储和传输较为常见,一旦涉及计算往往需要先解密,以明文形式计算后再加密.全同态加密(fully homomorphic encryption,FHE)将加密延展到计算层面,无需解密即可以完成密文的处理任务,有保护数据安全和用户隐私的天然特性.首个FHE方案于 2009年由Gentry提出,自此FHE方案一直备受业界和学界的关注.从FHE方案的构造思想、不同研究阶段及面临的问题等方面梳理分析了FHE 10余年的研究进展,从算法库实践、标准化进展以及典型应用场景等方面介绍了FHE的应用进展,并提出未来研究的方向建议.

    全同态加密LWE问题自举同态解密算法库

    支持策略更新和即时密文验证的外包属性基加密方案

    苏泽林张文芳王小敏
    3088-3097页
    查看更多>>摘要:属性基加密提供了全新的基于密码学的访问控制方案,适用于多用户数据共享场景,但由于加密阶段和访问策略更新过程的计算和通信开销较大,且现有的外包属性基加密方案大多数都没有提供面向数据拥有者的密文正确性验证方法,很大程度上限制了属性基加密的实际应用.针对上述问题,提出了一种支持动态策略更新和即时验证密文正确性的属性基外包加密方案,能够在不可信云环境下有效地保护数据的隐私性.方案根据外包加密原理设计策略更新过程,只需要完成少量计算即可生成更新密钥.利用双线性对的运算特性和解密运算结构设计密文验证算法,通过引入验证转换密钥使密文验证效率明显高于解密运算效率.方案根据不同的云环境模型设计了高效验证算法和严格验证算法,分别适用于诚实且好奇和不可信的云环境中.方案在标准模型下被证明满足选择明文攻击安全性.性能分析和效率对比表明,该方案的本地加密、策略更新和密文验证的计算量都有所减少,使得整体方案较现有方案更加轻量化,适用于资源受限设备的数据共享场景.

    属性基加密策略更新密文重加密外包加密可验证密文

    使用编码的反向散射通信协议设计与性能分析

    何昕吴帆祝玉军许勇...
    3098-3107页
    查看更多>>摘要:周围环境中不断增加的物联网设备带来了巨大的机遇,但也带来了挑战,包括有限的电池寿命、低计算能力和多址接入的可扩展性.反向散射通信使得无处不在的物联网设备能够以超低功耗的方式进行通信,然而,支持大规模并发通信也是反向散射通信需要研究的问题之一.针对大规模标签并发通信误码率(BER)较高、传输速率低等问题,设计基于编码的码分多址(CDMA)接入技术,以支持多标签反向散射并发可靠通信.首先,该系统利用沃尔什(Walsh)码等正交性较强的码片区分标签并结合纠错编码,以增强抗干扰能力;其次利用相关检测与译码联合解码以降低误码率,实现信道的可靠通信;最后,在此基础上,基于K均值聚类算法(K-means clustering algorithm)设计标签分组机制,充分利用时-码 2维资源扩充容量.实验表明,该方案能够实现100+个标签的可靠通信,误码率约2%、吞吐量达到了39 Mbps.

    反向散射通信多标签码分多址接入分组算法性能评价