首页期刊导航|国防科技大学学报
期刊信息/Journal information
国防科技大学学报
国防科学技术大学
国防科技大学学报

国防科学技术大学

杨学军

双月刊

1001-2486

xuebao@nudt.edu.cn

0731-84572637

410073

湖南省长沙市开福区德雅路109号

国防科技大学学报/Journal Journal of National University of Defense TechnologyCSCD北大核心CSTPCDEI
查看更多>>《国防科技大学学报》是由国防科技大学主办和主管的工程技术和自然科学综合性学术期刊,创办于1956年。它的主要宗旨是吸纳优秀稿件,报道最新科研成果,创办精品期刊,发现人才,培养人才,促进学术交流。学报现为双月刊,向国内外公开发行。学报进入的国外数据库或文摘刊物主要有:美国的《EI page one数据库》、美国的《化学文摘》(CA)、美国的《国际宇航文摘》(IAA)、英国的《科学文摘》(SA)、日本的《科学技术文献速报》(CBST)、俄罗斯的《文摘杂志》(РЖ)、英国的《INSPEC数据库》、美国剑桥科学文摘社网站:工程材料文摘(CSA-EMA)、美国剑桥科学文摘社网站:电子与通讯文摘等。学报进入的国内数据库或文摘刊物主要有:《中国科技论文统计分析数据库》、《中国科学引文数据库》、《中国学术期刊综合评价数据库》、《电子科技文摘》、《中国无线电电子学文摘》、《中国数学文摘》、《中国力学文摘》、《中国物理文摘》、《中国光学与应用光学文摘》等`。学报全文进入《中国学术期刊(光盘版)》、《中国期刊网》和《万方数据(ChinaInfo)系统》,实行纸张印刷版-光盘版-网络版三位一体的出刊模式。
正式出版
收录年代

    多核数字信号处理卷积算法并行优化

    许金伟王庆林李娅琳姜晶菲...
    103-112页
    查看更多>>摘要:针对国防科技大学自主研发的异构多核数字信号处理(digital signal processing,DSP)芯片的特征以及卷积算法自身特点,提出了一种面向多核DSP架构的高性能多核并行卷积实现方案.针对1×1 卷积提出了特征图级多核并行方案;针对卷积核大于1 的卷积提出了窗口级多核并行优化设计,同时提出了逐元素向量化计算的核内并行优化实现.实验结果表明,所提并行优化方法实现单核计算效率最高能达到64.95%,在带宽受限情况下,多核并行扩展效率可达到48.36%~88.52%,在典型网络ResNet50 上的执行性能与E5-2640 CPU相比,获得了5.39 倍性能加速.

    多核DSP卷积神经网络卷积算法并行优化

    注意力机制量化剪枝优化方法

    何源宏姜晶菲许金伟
    113-120页
    查看更多>>摘要:面向基于注意力机制模型的巨大计算和访存开销问题,研究量化和剪枝协同优化的模型压缩技术,提出针对注意力机制中查询、键、值、概率共四个激活值矩阵的对称线性定点量化方法.同时,提出概率矩阵剪枝方法和渐进式剪枝策略,有效降低剪枝精度损失.在不同数据集上的实验结果表明,针对典型基于注意力机制模型BERT,在较低或者没有精度损失的情况下该优化方法可达到4 位或8 位定点量化、0.93~0.98的稀疏度,大幅度降低模型计算量,为加速量化稀疏模型的推理奠定良好的基础.

    自然语言处理注意力机制量化剪枝

    长向量处理器高效RNN推理方法

    苏华友陈抗抗杨乾明
    121-130页
    查看更多>>摘要:模型深度的不断增加和处理序列长度的不一致对循环神经网络在不同处理器上的性能优化提出巨大挑战.针对自主研制的长向量处理器FT-M7032,实现了一个高效的循环神经网络加速引擎.该引擎采用行优先矩阵向量乘算法和数据感知的多核并行方式,提高矩阵向量乘的计算效率;采用两级内核融合优化方法降低临时数据传输的开销;采用手写汇编优化多种算子,进一步挖掘长向量处理器的性能潜力.实验表明,长向量处理器循环神经网络推理引擎可获得较高性能,相较于多核ARM CPU以及Intel Golden CPU,类循环神经网络模型长短记忆网络可获得最高62.68 倍和3.12 倍的性能加速.

    多核DSP长向量处理器循环神经网络并行优化

    高性能异构加速器MiniGo算子优化方法

    乔鹏贺周雨李荣春姜晶菲...
    131-140页
    查看更多>>摘要:根据高性能异构加速器的特性和MiniGo的训练模式提出了一种高效的并行计算方法.对片上计算资源进行合理规划,实现异构设备之间的流水并行优化;根据异构设备间存在共享存储段设计了共享内存编码模式,减少数据传输开销;根据数字信号处理簇内具有多计算资源的特点结合算子计算-访存特性设计了不同的算子并行计算优化策略.同时,面向TensorFlow实现了一个易于使用的高性能计算库.实验结果显示,该方法实现了典型算子的多核并行计算.相对于单核,卷积算子加速比为24.69.相较于裁剪版8 核FT2000 +CPU,该方法训练和自博弈执行速度加速比分别为3.83 和1.5.

    异构计算算子优化卷积神经网络强化学习

    面向GPU的5G新型无线电的高吞吐率LDPC译码器

    李荣春周鑫乔鹏王庆林...
    141-148页
    查看更多>>摘要:提出了一种基于图形处理单元(graphic processing unit,GPU)的 5G软件无线电准循环低密度奇偶校验(low density parity check,LDPC)码译码器,为了节省片上和片下带宽,采用码字缩短和打孔技术、两级量化和数据打包方案,以提升数据带宽的利用率.实验基于Nvidia RTX 2080Ti GPU平台实现了高码率情况下的最小和近似译码算法的并行译码,通过分析GPU上的最优线程设置,将码率为 5/6 的(2 080,1 760)LDPC算法的译码吞吐率提升至1.38 Gbit/s,译码吞吐率性能优于现有其他基于GPU的LDPC译码器.

    低密度奇偶校验5G图形处理单元软件无线电

    面向空间应用的GaN功率器件及其辐射效应

    毕津顺沈立志梅博曹爽...
    149-159页
    查看更多>>摘要:研究氮化镓(GaN)功率器件及其辐射效应对于解决空间应用需求、促进新一代航天器建设具有重大意义.介绍了GaN功率器件的主要结构及工作原理,综述了近年来国内外在GaN功率器件的总剂量效应和单粒子效应两方面的研究进展,并对辐射效应在GaN功率器件中造成的退化和损伤机制进行分析与讨论.研究结果显示:GaN功率器件具有较强的抗总剂量能力,但是抗单粒子能力较弱,易发生漏电和单粒子烧毁,且烧毁点多发生在栅极边缘的漏侧.对GaN功率器件辐照损伤机理的研究缺乏权威理论,有待进一步探索,为其空间应用提供理论支撑.目前,平面结构的GaN功率器件是主流的技术方案,单片集成及高频小型化是GaN功率器件未来发展的方向.

    GaN功率器件总剂量效应单粒子效应空间应用

    定向毫米波网络邻居发现协议

    梁仕杰赵海涛张姣陈海涛...
    160-169页
    查看更多>>摘要:针对定向毫米波网络各节点间无波束方向先验信息导致邻居发现困难的问题,提出了一种基于盲交汇算法的邻居发现协议,推导了邻居发现过程中时隙长度、波束个数与邻居发现时间之间的理论关系.进一步,为了缩短邻居发现的时间,在盲交汇算法的邻居发现协议的基础上,提出了基于位置预测的邻居发现协议.仿真结果表明,基于盲交汇算法的邻居发现协议的最长邻居发现时间小于无协调的定向邻居发现协议,波束个数N接近2n(2n-1<N≤2n,n>1,n∈Z)时,平均邻居发现时间低于无协调的定向邻居发现算法.此外,基于位置预测的邻居发现协议可以有效缩短邻居发现时间.

    毫米波盲交汇邻居发现MAC协议

    球形破片侵彻明胶运动模型及破片参数敏感性分析

    蒋明飞陈莉刘坤赵磊...
    170-178页
    查看更多>>摘要:为揭示球形破片对人体组织致伤机理,以明胶作为人体组织的替代物,基于动态空腔膨胀理论,考虑球形破片未完全侵入阶段的速度衰减,建立了球形破片侵彻明胶的分段运动理论模型,研究了球形破片侵彻明胶的运动规律.通过钢球和钨球侵彻明胶的实验验证了模型的正确性,求解了模型中的最优阻力系数.分析了理论计算过程中的误差来源,并推导得到了无量纲侵彻深度的表达式.利用Sobol'法进行了球形破片参数(直径、密度和速度)对侵彻深度影响的敏感性分析.结果表明:运动模型能够较好地模拟球形破片的运动规律;低密度的球形破片在未完全侵入阶段的速度衰减不能忽略;球形破片参数对侵彻深度影响的敏感性由高到低依次是速度、密度和直径.

    爆炸力学球形破片明胶侵彻敏感性

    基于权重的AHP判断矩阵一致性调整方法

    耿正霖吴佳妮程兴华包长春...
    179-186页
    查看更多>>摘要:传统的判断矩阵调整方法计算得到的权重不能最大限度地保留原始判断矩阵的信息.为此,提出一种基于权重的判断矩阵调整方法.该方法根据权重的性质,构造完全一致矩阵,利用AdaGrad最速下降法对矩阵进行拟合,使该矩阵相对于原始判断矩阵的总改变量最小,以其对应的权重作为矩阵的计算结果.数值计算结果表明,该方法相比于其他方法,权重对原始判断信息的保留度更高,且不需要反复进行矩阵一致性检验.

    层次分析法判断矩阵一致性调整AdaGrad

    采用重组模板的权重优化WENO-Z格式

    柴得林王强易贤刘宇...
    187-197页
    查看更多>>摘要:针对精确模拟含激波等复杂流动结构的流场对高精度格式的低耗散低色散要求,基于5 阶有限差分WENO-Z格式,提出一种模板重组技术.在计算WENO非线性权时,引入一个由 3 点模板重新组合的4 点模板,优化原格式中各模板的权重分配,进而提出了两种改进WENO-Z格式.采用近似色散关系分析方法对改进前后格式色散与耗散特性进行了对比与分析.分析表明:两种改进格式耗散有不同程度的降低.数值实验表明:改进格式具有更优越的激波捕捉性能,对小尺度流场结构具有更高的分辨率.

    模板重组权重WENO格式