首页期刊导航|计算机工程与科学
期刊信息/Journal information
计算机工程与科学
国防科学技术大学计算机学院
计算机工程与科学

国防科学技术大学计算机学院

王志英

月刊

1007-130X

jsjgcykx@163.net

0731-84576405

410073

湖南省长沙市开福区德雅路109号国防科技大学计算机学院

计算机工程与科学/Journal Computer Engineering and ScienceCSCD北大核心CSTPCD
查看更多>>本刊系国防科技大学计算机学院主办的计算机类综合性学术刊物,属中国计算机学会会刊,已先后被列为中文核心期刊、中国科技核心期刊、中国学术期刊(光盘版)全文入编期刊、中国科学引文数据库来源期刊(CSCD核心)、中国学术期刊综合评价数据库来源期刊。
正式出版
收录年代

    基于SRAM缓存和存内计算的低功耗关键词唤醒系统

    黄至锐贾心茹朱浩哲陈迟晓...
    1331-1339页
    查看更多>>摘要:为了解决关键词唤醒算法部署在边缘计算硬件会带来较高功耗、给电池驱动的设备带来续航挑战的问题,提出了一种基于存内计算技术和软硬件协同优化的低功耗关键词唤醒系统.在算法层面,基于标准MFCC算法拓扑结构提出了一种三值量化MFCC-CNN联合算法,将MFCC中的全部通用矩阵乘映射到神经网络加速器当中.在电路层面,提出了一种基于SRAM的存内计算核心,用于解决传统冯·诺依曼架构加速器存在的功耗墙和存储墙问题.同时通过复用存内计算核心的SRAM存储功能提出了一种基于查找表实现的缓存电路,用于替代寄存器延迟链电路.SRAM存内计算核心和SRAM缓存电路均采用定制单元实现.在系统层面,基于以上2种定制电路设计了一种低功耗关键词唤醒系统.该系统采用ASIC与定制化电路设计流程设计,并使用28 nm CMOS工艺库对该设计进行了ASIC综合,在250 kHz下,关键词唤醒系统运行10分类任务的延迟是64 ms,整体功耗为645.28 μW,其中MFCC流水线的动态功耗占总动态功耗的5.9%,总功耗仅占系统功耗的1.3%.

    唤醒三值量化神经网络存内计算串行快速傅里叶变换软硬件协同设计

    基于FPGA和行折叠的稀疏矩阵向量乘优化

    周智高建花计卫星
    1340-1348页
    查看更多>>摘要:稀疏矩阵向量乘(SpMV)是科学与工程计算中的一个关键内核.由于稀疏矩阵中不规则的数据分布和SpMV计算中不规则的访存操作,SpMV在多核CPU和GPU等设备上的性能与这些设备的理论峰值还具有较大差距.现有的CPU和GPU由于在架构上受到限制,导致它们无法很好地利用稀疏矩阵的特殊结构来加速SpMV计算,而现场可编程门阵列(FPGA)可以通过自定义电路实现高效的并行运算,能够更好地处理稀疏矩阵的计算和存储问题.基于FPGA提出了一种SpMV优化方法,该优化方法基于高级综合的流式处理引擎,采用了一种自适应多行折叠的SpMV优化策略.该方法通过行折叠减少了处理引擎中零元的无效存储和计算,从而提升了基于FPGA的SpMV计算性能.实验结果表明,相比于现有的FPGA实现方案,设计的基于行折叠优化的数据流引擎实现了最高1.78倍和平均1.15倍的加速.

    稀疏矩阵向量乘现场可编程门阵列高级综合行折叠

    面向离散粒子多尺度分析CPU/GPU架构的并行近邻搜索算法

    代长威孔瑞林季哲
    1349-1360页
    查看更多>>摘要:离散粒子法在解决前沿科学和工程领域中的复杂多尺度问题中具有广泛的应用.针对离散粒子大规模多尺度计算中相邻粒子对搜索过程计算复杂度显著增加和并发度下降的问题,提出了一种适用于众核架构(CPU/GPU)的高并发、低内存占用并行近邻搜索算法.通过提出一种基于多层嵌套网格概念的层间相互作用方法,解决了不同层级间粒子对相互搜索时的数据竞争问题;通过引入非对称映射方法,避免了粒子在多级链表上的全映射,降低了内存消耗.一系列数值实验表明,该算法可有效处理108量级粒子体积跨度变化的多尺度问题,相较于传统算法可取得2~8倍的加速效果和更低的内存消耗特性,基于GPU的算法实现可达到当前领先的计算效率.

    离散粒子法多尺度分析近邻搜索并行算法

    边缘侧神经网络块粒度领域自适应技术研究

    辛高枫刘玉潇张青龙韩锐...
    1361-1371页
    查看更多>>摘要:深度神经网络在边缘设备上运行时会面临模型缩放和域自适应2个挑战,现有的模型缩放技术和无监督在线域自适应技术存在缩放粒度粗、缩放空间小和在线域自适应时间长的问题.针对这2个挑战,提出一种块粒度的模型缩放和域自适应训练方法EdgeScaler,它包括离线和在线2个阶段.针对模型缩放挑战,离线阶段能够从各种DNN中检测和抽取块,并将其转换为多个派生块;在线阶段基于块和块之间的组合,提供大规模的缩放空间,解决模型缩放问题.针对域自适应挑战,设计了一种针对于块的残差Adapter,在离线阶段将其插入块中;在线阶段当新的目标域到来时,对所有的Adapter进行训练,解决块粒度缩放空间中所有选项的域自适应问题.在真实的边缘设备Jetson TX2上的测试结果表明,在提供大规模缩放选项的基础上,所提方法可以将域自适应训练时间平均减少85.14%,训练能耗平均减少84.1%.

    深度神经网络边缘设备弹性缩放域自适应

    基于DPCT的序列比对软件迁移与性能评估

    李沛桢张洋陈文波
    1372-1380页
    查看更多>>摘要:利用GASAL2序列比对软件探索CUDA程序迁移到DPC++的过程.迁移过程中利用DPCT工具自动将CUDA API转换至DPC++API.然而,迁移后的代码仍需经过适配和修改才能正确编译和运行.评估DPCT工具从CUDA程序迁移到DPC++程序的有效性,并展示DPC++在不同架构下的高效性.实验证明迁移后的程序保持了原始程序的精确度,且无需代码修改便可在异构设备Intel GPU架构上运行,同时迁移后的基于DPC++的GASAL2异构计算性能可以达到原始基于CUDA GASAL2的计算性能的大约90%~95%,充分展现了DPC++异构编程的可行性,为跨平台异构编程充分利用更广泛的硬件支持提供了有前景的解决方案.

    异构计算oneAPI生物信息学序列比对

    一种基于动态空间划分和压缩布隆过滤器相结合的分布式元数据负载均衡算法

    薛梅婷俞万刚张纪林曾艳...
    1381-1389页
    查看更多>>摘要:分布式元数据管理系统利用多个元数据服务器对大量元数据进行存储和管理.该系统将海量元数据通过不同的映射策略分配到不同的元数据服务器上,减少单台元数据服务器所处理的数据量,从而减少磁盘访问次数,进而提高整个元数据管理系统的性能.元数据管理系统通常会使用哈希函数将元数据键映射到不同的元数据服务器中.然而,当数据特征值相似时,由于散列函数的单向性,会导致数据分布不均衡的问题,造成元数据服务器性能下降.为解决上述问题,提出了一种动态空间划分和压缩布隆过滤器相结合的元数据负载均衡算法,该算法首先构建一个哈希桶来组织元数据键,通过哈希算法将元数据键映射到不同的哈希桶中;在映射过程中,根据元数据服务器的负载情况动态调整目标哈希桶,并在上述哈希桶中有序地保存元数据键的映射信息.当访问元数据时,首先通过压缩布隆过滤器对元数据键进行预处理,然后通过二分查找在指定的哈希桶中进行元数据映射信息的查找.与近年来提出的元数据管理算法相比,所提算法在映射键发生倾斜时仍能保证元数据服务器负载均衡,并通过对比实验表明,所提算法相比最优的元数据管理算法,在内存占用仅提升2%的条件下,获得了20%的搜索性能提升.

    分布式元数据管理负载均衡算法一致性哈希压缩布隆过滤器

    基于BOOM处理器的访存逻辑优化

    周蔺宁刘杰李洪奎付浩东...
    1390-1394页
    查看更多>>摘要:BOOM处理器采用的Store指令回查策略虽然解决了访存指令乱序执行引发的数据冲突问题,但是该策略会导致流水线的大量冲刷,降低了处理器的性能.对此,提出了一种访存指令的相关性预测方法.该方法取消了Load指令访存前的查询操作,增加了Load指令相关性预测表,只有预测为无相关性的Load指令才可以乱序执行.这种方法在保证程序逻辑正确的前提下避免了大量冲刷流水线.测试程序采用SPEC CPU 2006下的7个子程序,实验结果表明,改进后的处理器执行程序的性能平均提升了3.5%.

    乱序执行访存指令相关性预测

    S-JSMA:一种低扰动冗余的快速JSMA对抗样本生成方法

    刘强李沐春伍晓洁王煜恒...
    1395-1402页
    查看更多>>摘要:基于深度学习神经网络模型的技术被广泛应用在计算机视觉、自然语言处理等领域.然而,研究人员发现,神经网络模型自身存在着显著的安全隐患,例如,容易遭到对抗样本的攻击.研究针对图像分类的对抗样本相关技术能帮助人们认识到神经网络模型的脆弱性,进而推动相关模型的安全加固机制研究.针对JSMA方法存在高时间开销与扰动冗余的问题,提出了一种低扰动冗余的快速JSMA对抗样本生成方法S-JSMA.该方法使用单步操作替代迭代操作以简化JSMA的算法流程,并使用简易扰动取代JSMA中基于显著图的扰动,从而极大地降低了对抗样本生成的时间开销和扰动冗余.基于MNIST数据集的实验结果表明,相较于JSMA和FGSM方法,S-JSMA能在显著短的时间内取得较好的攻击效果.

    深度学习神经网络图像分类对抗样本

    智慧医疗系统中可容错的多维度密文跨域聚合方案

    张晓均李兴鹏张经伟唐伟...
    1403-1413页
    查看更多>>摘要:为解决智慧医疗系统中数据孤岛问题,实现医疗数据安全汇聚的目标,同时确保医疗数据传输与存储过程的机密性、完整性与可用性,提出了支持传输容错的可验证多维医疗密文跨域聚合方案.该方案将边缘服务器集成到传统的云计算架构,通过设计同态加密算法,并结合Shamir秘密共享技术,实现多维度加密数据可传输容错的2层聚合.该方案设计了基于椭圆曲线的数字签名算法,确保医疗加密数据在传输与存储过程中的完整性.医疗数据分析中心可以向云服务器灵活选取目标区域进行跨域聚合,并借助云审计机制对获取到的聚合结果进行轻量级完整性验证.根据霍纳法则,医疗数据分析中心利用解密私钥可以直接获得相应区域终端用户各个维度医疗数据的聚合结果.通过安全性分析与性能比较表明,该方案能够安全高效地部署在智慧医疗系统.

    医疗密文边缘计算跨域聚合传输容错完整性验证

    区域敏感的群智感知隐私保护任务分配机制

    王永军刘瀚阳王辉申自浩...
    1414-1424页
    查看更多>>摘要:为解决现有移动群智感知任务分配机制对地理区域不敏感造成的效率与隐私问题,设计了一种基于区域热度的任务分配机制(HTPM).该机制通过对历史数据的分析实现任务个性化发布,提高工作者申请成功率,减少位置隐私暴露次数.首先,基于Geohash算法的自适应网格划分算法(G-AGM)通过对历史数据分析完成对任务区域的划分;其次,HTPM依据划分结果赋予任务位置相对应的任务匹配前缀,并根据招聘结束时间动态更新任务匹配前缀完成任务发布;最后,使用概率代价最小胜者选择机制(LPC-WSM)完成胜者的选取.基于墨西哥城和基多出租车数据集的仿真实验表明,使用HTPM机制的人均申请次数降低30.3%,可以达到保证位置隐私保护强度、提高任务分配效率的目的.

    移动群智感知任务分配位置隐私保护差分隐私Geohash