首页期刊导航|计算机工程与科学
期刊信息/Journal information
计算机工程与科学
国防科学技术大学计算机学院
计算机工程与科学

国防科学技术大学计算机学院

王志英

月刊

1007-130X

jsjgcykx@163.net

0731-84576405

410073

湖南省长沙市开福区德雅路109号国防科技大学计算机学院

计算机工程与科学/Journal Computer Engineering and ScienceCSCD北大核心CSTPCD
查看更多>>本刊系国防科技大学计算机学院主办的计算机类综合性学术刊物,属中国计算机学会会刊,已先后被列为中文核心期刊、中国科技核心期刊、中国学术期刊(光盘版)全文入编期刊、中国科学引文数据库来源期刊(CSCD核心)、中国学术期刊综合评价数据库来源期刊。
正式出版
收录年代

    基于NUMA云计算架构的多资源分配可信拍卖机制

    徐嘉张骥先王喆民刘林杰...
    761-775页
    查看更多>>摘要:随着互联网不断发展,云计算和虚拟化等技术广泛投入使用,设计可信拍卖机制为云服务商进行社会福利最大化的虚拟资源分配,是当前云计算领域的研究重点之一。同时,随着服务器规模不断扩展,诸多主流数据中心的服务器正在升级为非统一性内存访问 NUMA 架构,其主要特征为,每台服务器可由多个计算节点构成,每个节点包含若干处理器和存储器,既可作为独立计算单元,也可以相互连通访问。但是,当前的研究主要着眼于传统的统一性内存访问架构,无法适应 NUMA架构下的应用场景。因此,提出了一种适用于NUMA架构下的多资源可信拍卖机制,以虚拟机的形式进行多种资源的组合分配。具体而言,在资源分配问题中,提出一种单调启发式分配算法,考虑了 NUMA 架构下的部署约束和资源优势密度等因素,有效提升了社会福利。在价格支付问题中,使用二分法设计一种符合关键价格理论的定价支付算法,从而保证机制的可信特征。经过实验测试,该机制在社会福利、用户支付费用和资源利用率等方面,整体性能达到最优解的 96%左右。

    云计算资源分配非统一性内存访问拍卖机制可信

    EMRI-Tree:面向多分辨率可视化的层次式数据结构

    钟权陈志广高蓝光
    776-784页
    查看更多>>摘要:大规模科学数据的可视化要求极高的数据传输带宽和大量的内存,实现对可视化数据的高效处理是一个巨大的挑战。为了提高科学可视化的效率,最常见且直接的办法是减少需要处理的数据量。通过设计一种新的数据结构EMRI-Tree以及一种可行且灵活的渲染流程,提出了一种新的大规模数据量可视化方案。该方案的特点可以总结如下:首先,所提出的EMRI-Tree支持对大型3D模型进行高效的数据查询和感兴趣区域(ROI)数据获取,从而显著降低内存占用;其次,EMRI-Tree中不同分辨率级别的数据块以可变长度索引的形式存储在键值(KV)存储系统中,提高了存储的可扩展性和读取的并发性;最后,提出了一种基于射线行走的渐进式渲染预取方案,可以在交互时渲染出更精确的模型。综合上述优化方法,该方案可在内存开销有限的情况下,有效促进大规模高分辨率数据的可视化。通过使用80 GB的合成数据进行了 10 次模拟读取测试来评估方案效果,实验结果表明,该方案具有 2 000+QPS(每秒查询次数)和内存消耗线性增长的特点,是一种稳健且节省内存的方案。

    多维索引八叉树数据稀疏化渐进式探索大数据可视化

    基于蜂鸟E203的多级动态分支预测器

    魏一杨智杰铁俊波石伟...
    785-793页
    查看更多>>摘要:近年来,以蜂鸟E203 为代表的开源RISC-V微处理器由于功耗低、性能好等优势,受到了学术界和工业界的广泛关注和应用。为提高微处理器性能,降低分支指令造成的流水线停顿,指令分支预测技术成为现代微处理器中广泛应用的重要技术之一。然而,蜂鸟 E203 现采用的分支预测器是轻量级的静态分支预测器,面临分支预测准确率较低的挑战。由于使用预测准确率较高的动态分支预测器,可以进一步降低由于预测错误导致的重定向取指所产生的开销,因此,针对上述挑战,在原微架构的基础上探索了多种动态分支预测器的实现,提高了分支预测精度并且兼顾了资源开销。实验结果表明,多种动态分支预测器中获得最优结果的是使用静态分支预测结合基于分支历史寄存器 BHR 的自适应动态分支预测器,在Dhrystone基准测试程序上其分支预测精度可从原来的 84。6%最高提升至 94。8%,分数从原来的1。296 463 提高到 1。314 418,在 Coremark 基准测试程序上其分支预测精度可从原来的 67%提升至78。7%,分数从原来的 2。120 000 提升至 2。138 008。

    动态分支预测蜂鸟E203RISC-V流水线微架构

    CCGA器件的制备与高精度组装技术

    李留辉王亮杨春燕陈轶龙...
    794-800页
    查看更多>>摘要:CCGA封装器件具有良好的抗热膨胀失配等性能,在很多高可靠领域有广泛应用。针对CCGA封装器件的制备和高精度组装问题,开展了陶瓷管壳制备、高精度植柱工装设计、焊膏涂覆和器件植柱等研究。采用高温共烧陶瓷技术制备了 2 种带有菊花链的CCGA陶瓷管壳,可用于复杂链路的灵活设计。设计并加工了厚度为 1。6 mm、开孔直径为 0。54 mm的高精度植柱工装。对比丝网印刷和焊膏喷印方法,使用焊膏喷印法优化参数,提高了焊膏的体积精度,相对偏差小于 10%。制备了高精度植柱样件,焊柱倾斜度小于 1°,共面度小于 0。1 mm,位置度优于±0。02 mm。该方法可有效提高 CCGA 器件的植柱精度和焊柱对称性,且有助于保证后续板级焊接的精度与可靠性。

    陶瓷柱栅阵列(CCGA)植柱焊膏喷印焊接

    基于异常保持的弱监督学习网络入侵检测模型

    谭郁松王伟蹇松雷易超雄...
    801-809页
    查看更多>>摘要:网络入侵检测系统对维护网络安全至关重要,目前针对只有较少异常标记网络数据的入侵检测场景的研究较少。基于数据的异常保持性,设计了基于异常保持的弱监督学习网络入侵检测模型WIDS-APL,该检测模型包含数据转换层、表征学习层、转换分类层和异常判别层 4 部分,利用一组可学习的编码器将样本映射到不同区域并压缩到超球体,利用异常样本的标签信息学习正常样本和异常样本的分类界限,得到样本的异常分数。在 4 个数据集上的测试结果表明了该模型的有效性和鲁棒性,相比 4 个主流算法,在 AUC-ROC值上分别提升了 4。80%,5。96%,1。58%和 1。73%,在AUC-PR 性能上分别提升了 15。03%,2。95%,4。71%和 9。23%。

    网络入侵检测弱监督学习深度学习

    一种面向低功耗移动端到端系统的延迟推送同步策略

    赵悦周桐庆曾晖蔡志平...
    810-817页
    查看更多>>摘要:互联网技术的快速发展使得移动设备在人们生活中发挥了更多的作用。一个用户可能拥有多台设备,以满足办公、社交和娱乐等多种需要。现实应用中,同一用户多台设备间也面临着许多数据同步需求,来支持跨设备访问时的分布式应用(例如,跨设备视频续播)。然而,目前针对多个端到端的数据同步的研究较少。因此,提出了一种适用于用户多台移动设备间应用同步的数据推送策略 PAD,该策略采取差异化方式对待活跃设备和睡眠设备,以灵活延迟开启睡眠设备发送数据副本。延迟决策基于AIMD的动态自适应调整方法和面向应用访问频率的调度增强机制,适配用户使用习惯自适应地推送同步。实验结果表明,相比于无差别推送同步方案,PAD 推送策略可以显著降低数据同步对设备的开启次数,同时保证较低的数据访问错误率,实现一致性和功耗的平衡。

    移动系统数据同步同步功耗AIMD

    SRv4:面向IPv4的段路由数据面协议设计及实现

    原玉磊赵宝康吕高锋
    818-825页
    查看更多>>摘要:针对SRv6 技术报文头过长导致的承载效率低且无法在 IPv4 网络中部署的缺点,提出一种面向IPv4 网络的段路由技术SRv4。设计了SRv4 的报文头格式以及在 IPv4 网络中的报文封装格式;设计了SRv4 的报文处理指令和报文转发流程;SRv4 兼容IPv4 协议和现有 IPv4 网络设备,可在 IPv4 网络中增量部署;与SRv6 相比,SRv4 的SID长度减小了 75%,承载效率更高。利用 XDP 技术在 Linux内核中开发了SRv4 模块,以验证SRv4 设计的可行性,利用服务器搭建网络环境对 SRv4 模块的功能、性能和稳定性进行测试。测试结果表明,SRv4 模块段路由功能正常,可稳定运行。

    段路由SRv6SRv4XDPIPv4

    基于双层注意力和深度自编码器的时间序列异常检测模型

    尹春勇赵峰
    826-835页
    查看更多>>摘要:目前时间序列通常具有弱周期性以及高度复杂的相关性特征,传统的时间序列异常检测方法难以检测此类异常。针对这一问题,提出了一种新的无监督时间序列异常检测模型(DA-CBG-AE)。首先,使用新型滑动窗口方法,针对时间序列周期性设置滑动窗口大小;其次,采用卷积神经网络提取时间序列高维度空间特征;然后,提出具有堆叠式Dropout双向门循环单元网络作为自编码器的基本结构,从而捕捉时间序列的相关性特征;最后,引入双层注意力机制,进一步提取特征,选择更加关键的时间序列,从而提高异常检测准确率。为了验证该模型的有效性,将DA-CBG-AE 与 6 种基准模型在 8 个数据集上进行比较。最终的实验结果表明,DA-CBG-AE 获得了最优的F1 值(0。863),并且其检测性能相比最新的基准模型Tad-GAN高出 25。25%。

    异常检测双层注意力机制自编码器卷积神经网络双向门循环单元

    类别特征约束的多目标域表情识别方法

    范琪王善敏刘成广刘青山...
    836-845页
    查看更多>>摘要:表情识别FER方法通常会受到采集环境和受试者区域、种族等因素的影响。为了提升 FER方法的泛化性能,无监督的域自适应表情识别方法 UDA-FER 成为了研究热点。现有的 UDA-FER 方法普遍存在 2 个问题:(1)仅关注对目标域的识别率,导致方法从源域迁移至目标域后,对源域的识别率急剧下降;(2)仅研究基于单个目标域的UDA-FER方法,将现有方法直接应用于多个目标域会导致方法识别率骤降。为解决上述问题,提出了一种类别特征约束的多目标域表情识别方法 MTD-FER,实现 FER向多个目标域的连续迁移。为了保持对源域的识别率并提高对多个目标域的识别率,MTD-FER 设计了类别自适应的伪标签标记CAPL模块和类别特征约束 CWFC 模块,挑选目标域高质量的样本标记为伪标签,并对齐各个域同类样本的特征,缓解连续迁移导致的灾难性遗忘问题。以 RAF-DB 为源域,FER-2013 和ExpW为目标域,进行大量的实验,证明了 MTD-FER 的有效性。实验结果表明,与基准方法相比,MTD-FER在多次迁移后,源域识别率提升 6。36%,与迁移之前基本持平;在各个目标域性能均有所提升,其中FER-2013 性能提升了 27。33%,ExpW性能提升了 3。03%。

    人脸表情识别无监督域自适应多目标域类别自适应的伪标签类别特征约束

    ELPVO:基于I/O流水优化的超低功耗视觉里程计

    赵千贺王锐
    846-851页
    查看更多>>摘要:视觉里程计赋予了机器人自主定位与构建环境地图的能力,被广泛应用在各类无人设备上。视觉里程计涉及大量的图像处理计算,但其部署平台多数仅具备极为有限的计算资源,限制了其使用范围。针对现有低功耗视觉里程计存在的I/O 瓶颈,提出一种面向STM32F7 嵌入式平台的基于RGB-D相机的高速低功耗视觉里程计ELPVO。ELPVO 充分考虑 STM32F7 平台的硬件资源,通过 DMA 传输提高处理器使用效率,进而在算法精度没有变化的情况下提升处理速度。在搭载 216 MHz ARM Cortex®-M7 处理器的STM32F767 嵌入式平台上,以TUM RGB-D数据集作为测试基准,ELPVO 对 320×240 分辨率的图像处理速度可以达到 26 fps,整体运行速度提升了 84%,运行功耗维持在 0。7 W。

    视觉里程计低功耗RGB-D相机