首页期刊导航|计算机工程与科学
期刊信息/Journal information
计算机工程与科学
国防科学技术大学计算机学院
计算机工程与科学

国防科学技术大学计算机学院

王志英

月刊

1007-130X

jsjgcykx@163.net

0731-84576405

410073

湖南省长沙市开福区德雅路109号国防科技大学计算机学院

计算机工程与科学/Journal Computer Engineering and ScienceCSCD北大核心CSTPCD
查看更多>>本刊系国防科技大学计算机学院主办的计算机类综合性学术刊物,属中国计算机学会会刊,已先后被列为中文核心期刊、中国科技核心期刊、中国学术期刊(光盘版)全文入编期刊、中国科学引文数据库来源期刊(CSCD核心)、中国学术期刊综合评价数据库来源期刊。
正式出版
收录年代

    基于PSS+PXF的ISF高精度振荡器噪声分析模型

    袁珩洲桑浩刘胜陈小文...
    951-958页
    查看更多>>摘要:提出了一种基于PSS+PXF的ISF的相位噪声模型,用于预测振荡器的相位噪声。该模型相对传统的拉扎维模型考虑了振荡器的非线性时变特性,因此更加精确。通过仿真验证了该模型的有效性,基于PSS+PXF的ISF的相位噪声模型精度相比传统拉扎维模型提升200%以上。

    振荡器高精度相位噪声振荡器脉冲灵敏度周期稳态周期传输函数

    基于Actor模型的众核数据流硬件架构探索

    张家豪邓金易尹首一魏少军...
    959-967页
    查看更多>>摘要:超大规模AI模型的分布式训练对芯片架构的通信能力和可扩展性提出了挑战。晶圆级芯片通过在同一片晶圆上集成大量的计算核心和互联网络,实现了超高的计算密度和通信性能,成为了训练超大规模AI模型的理想选择。AMCoDA是一种基于Actor模型的众核数据流硬件架构,旨在利用Ac-tor并行编程模型的高度并行性、异步消息传递和高扩展性等特点,在晶圆级芯片上实现AI模型的分布式训练。AMCoDA的设计包括计算模型、执行模型和硬件架构3个层面。实验表明,AMCoDA 能广泛支持分布式训练中的各种并行模式和集合通信模式,灵活高效地完成复杂分布式训练策略的部署和执行。

    晶圆级芯片分布式训练Actor模型众核数据流架构

    面向飞腾迈创DSP的自主软件栈设计

    时洋陈照云孙海燕王耀华...
    968-976页
    查看更多>>摘要:飞腾迈创DSP是国防科技大学计算机学院为了突破卡脖子技术,解决我国相关重点领域内芯片长久受制于人的现实问题而自主设计的高性能数字信号处理器。由于该系列芯片采用全自主设计的指令集,无法兼容已有的软件,一套自主完备且高效的软件栈是决定飞腾迈创DSP生命力的关键。基于团队长期以来的持续工作,系统阐述了飞腾迈创DSP软件栈的设计原则与层次化架构,重点介绍了包括支持层、编译层以及工具层在内的相关软件工具的创新功能、实现方法以及性能。同时,结合用户的反馈与团队的思考,还讨论了飞腾迈创DSP软件栈未来需要探索的相关问题。

    DSP软件栈编译器调试器自主芯片

    面向广义Chiplet的高速BGA与PCB传输结构设计

    陈天宇李川王彦辉
    977-983页
    查看更多>>摘要:从广义Chiplet互连设计出发,重点研究BGA区域孔串扰分析方法和优化措施。提出以单元阵列孔建模计算作为全芯片BGA区域孔串扰评估方式,进一步根据不同布线层互连分析需求构建了多层扇出的孔建模平台。单元阵列孔建模分析结果和多层扇出孔阵建模分析结果相互印证,说明以单元阵列作为串扰评估最小单元是准确的,多层扇出孔阵建模方式是高效可行的。采用多层扇出孔阵建模平台对2种BGA封装管脚对应的PCB孔串扰进行了对比分析。结果显示,在封装管脚设计时,提高邻近信号孔间距与邻近信号孔地孔间距比例比增加地孔数量和管脚间距更能有效地抑制串扰。

    单元阵列球栅阵列管脚分配信号完整性串扰

    面向众核CPU的稠密线性求解器性能评测与优化

    付晓苏醒董德尊钱程东...
    984-992页
    查看更多>>摘要:稠密线性求解器在高性能计算和机器学习等领域扮演着重要的角色。其典型的并行算法实现通常构建在著名的fork-join或task-based编程模型之上。尽管采用fork-join模型的主流稠密线性代数库能将大部分的计算转移到高度优化、高性能的BLAS 3例程上,由于fork-join不灵活的执行流,它们仍然未能高效地利用众核CPU的计算资源。采用task-based编程模型的开源库能实现更加灵活、负载更均衡的算法,因此能获得明显的性能提升。然而,在众核CPU平台上,尤其是对于中等矩阵规模的问题而言,它们仍然有较大的优化空间。对稠密线性求解器的性能进行了全面的测评,以定位性能瓶颈,并提出了2种优化策略,以提高程序性能。具体地,通过重叠LU分解和下三角求解的计算过程,减少同步开销线程的空等,从而提高算法的并行性;进一步通过减少冗余的矩阵打包操作,降低算法的访存开销。分别在2个主流的众核CPU平台(Intel® Xeon Gold® 6252N(48核)和HiSilicon Kunpeng 920(64核))上进行了性能评估。实验结果表明,该优化的稠密线性求解器在上述两个CPU平台上,相比最佳开源实现分别取得了10。05%(Xeon)和13。63%(Kunpeng 920)的性能提升。

    稠密线性求解器LU分解fork-join模型task-based模型众核CPU

    基于遗传算法的晶圆级芯片映射算法研究

    李成冉方佳豪尹首一魏少军...
    993-1000页
    查看更多>>摘要:近年来,随着人工智能领域的发展,深度学习已经成为如今最重要的计算负载之一,下一代人工智能以及高性能计算应用对计算平台的算力与通信能力提出了前所未有的需求,晶圆级芯片通过在整片晶圆上集成超高密度的晶体管数量以及互连通信能力,有望为未来的人工智能与超算平台提供革命性的算力解决方案。而其中,晶圆级芯片具有的超大计算资源和独特的新架构使得任务映射算法面临前所未有的新问题,相关研究成为近年来学术界的研究重点。专注于研究人工智能任务在晶圆级硬件资源的映射算法,即通过将人工智能算法表达为多个卷积核,再考虑卷积核的算力特性来基于遗传算法设计晶圆级芯片的映射算法。一系列映射任务下的仿真结果验证了映射算法的有效性,并揭示了执行时间、适配器成本等参数对代价函数的影响。

    晶圆级芯片遗传算法卷积网络映射人工智能通信开销

    带宽异构网络下的精确修复再生码数据修复方案

    王艳皮婵娟刘亚东施君豪...
    1001-1012页
    查看更多>>摘要:再生码技术以高容错性、低冗余开销等优点在数据存储领域得到了广泛应用,但基于再生码的冗余技术在修复失效数据时需从其他帮助节点下载多个编码块。考虑到节点间链路带宽的异构性,在实际网络中链路可用带宽容量变化很大,网络流量最小化并不一定意味着数据修复时间最小化,并且现有针对带宽异构网络下的再生码数据修复方案难以支持精确地修复再生码。由于精确修复再生码具有特定的数学结构,其并行修复难以实现,因此提出一个在带宽异构网络下实现精确修复再生码的数据修复方案ERC-TREE,此方案通过构建一棵最优树来有效利用帮助节点之间的可用带宽,从而实现失效节点数据的精确修复。仿真实验结果表明,在带宽异构网络下采用树型结构修复对精确修复再生码具有可行性。在带宽差异很大的情况下,ERC-TREE的数据修复时间相比星型结构的修复时间减少78%。

    再生码数据存储异构网络树型修复精确修复

    基于隐形后门水印的开源数据集版权保护

    黄智慧肖祥立张玉书薛明富...
    1013-1021页
    查看更多>>摘要:针对图像分类领域开源数据集的版权保护问题,提出了一种基于后门水印的可溯源方法IB-WOD,其能够保证水印在具有较强隐蔽性的同时保持良好的可用性和有效性。首先,利用一个编码器-解码器网络将后门水印嵌入到所选取的部分样本中,生成水印样本。接着,修改这些水印样本的标签为指定标签,然后将水印样本与未修改的样本合并为水印数据集。使用该水印数据集训练的模型会留下特定后门,即从后门水印到指定标签的一种映射关系。最后,提出了一种相应的模型验证算法,基于这种特殊的映射关系来验证一个可疑模型是否使用了水印数据集。实验结果表明,IBWOD能够很好地验证模型是否使用了水印数据集,并具有较强的隐蔽性。

    开源数据集版权保护后门水印机器学习图像分类

    基于标识密码的内生安全最短路径优先协议

    荀鹏陈红艳王勇志李世杰...
    1022-1031页
    查看更多>>摘要:路由协议如开放的最短路径优先协议OSPFV2的安全运行对网络的连通及信息安全传输至关重要。传统OSPFV2协议在设计上缺少抵御源路由伪造或路由信息篡改的能力,致使组网易遭遇攻击,而现有的安全策略多为外挂式,易引发新的安全问题或安全效能低,为此,提出基于标识密码的内生安全OSPFV2协议,将标识密码内嵌于路由交换流程内,使网络具备高效的、内生式的抵御路由在传输过程中的篡改和伪造攻击能力。另一方面,考虑大范围部署安全OSPFV2协议存在多种限制因素,利用不透明链路状态通告,设计支持增量部署的运行机制。仿真实验表明,设计的内生安全OSPFV2协议在不损耗过多收敛时延的同时,具备抵御源路由伪造、数据篡改的安全能力。

    OSPFV2协议源路由伪造内生安全标识密码

    区块链环境中的隐私保护推荐算法研究

    赵文韬官礼和何建国唐昊...
    1032-1040页
    查看更多>>摘要:针对区块链环境中推荐算法难以抵御恶意攻击和推荐效果不佳的问题,一方面,提出了基于整数向量的快速同态加密算法,对用户数据进行隐私保护,其安全性由LWE问题保证;另一方面,基于E2LSH设计了一种高效的个性化推荐算法,该算法根据哈希桶编号进行密钥分发,从而使得同一哈希桶中的用户能进行同态加密运算并快速计算相似度。在区块链+IPFS的基础系统模型上,使用公用数据集与最新相关的隐私保护推荐算法进行了对比实验,实验结果表明,所提算法在安全性和隐私性得到保障的同时拥有理想的推荐效果和速度。

    区块链隐私保护局部敏感哈希同态加密