首页期刊导航|高性能计算技术
期刊信息/Journal information
高性能计算技术
《高性能计算技术》编辑部
高性能计算技术

《高性能计算技术》编辑部

双月刊

江苏省无锡33信箱353号

高性能计算技术/Journal High Performance Computing Technology
正式出版
收录年代

    软件定义技术进展研究

    李宏亮过锋冯璇宋新亮...
    1-7页
    查看更多>>摘要:随着计算技术的不断发展革新,应用对计算技术提出了更加快速和多变的需求,而传统的软硬件紧耦合架构已经不合时宜,这时“软件定义”作为一种打破僵局的解决思路应运而生,成为近年来学术界和工业界关注的热点.本文对软件定义的网络、存储和数据中心的研究现状,特别是技术和应用层面的进展进行了深入研究,并对软件定义的高性能计算进行了简要的探讨,最后对软件定义的前景进行了展望.

    软件定义网络软件定义存储软件定义数据中心软件定义高性能计算

    HBM和HMC技术研究

    姚玉良钱宇施得君
    8-12页
    查看更多>>摘要:随着集成电路工艺技术的发展,处理器与存储器间性能差距越来越大,3D技术和TSV(硅通孔)技术的不断成熟,为高带宽、大容量的存储器提供了基础,混合存储立方(HMC)和高带宽存储器(HBM)就是其中两种典型的产品.本文主要介绍这两种存储器的组织架构和访存方式等,并对其进行了对比分析,为计算机产品的开发选型提供参考.

    混合存储立方高带宽存储器硅通孔

    一种基于FPGA的层次化排序结构

    李祥吴东谢向辉
    13-19页
    查看更多>>摘要:排序作为一个经典的基础算法,是很多其他算法的重要组成部分,在科学研究和实际应用中都有重要意义.本文在研究现有排序优化算法后,提出一种基于FPGA的层次化排序结构,可有效利用FPGA片上存储资源,将内存利用率由基础算法的33%提高到80%以上;针对中等数据规模,可大幅提高排序效率,相比软件算法,吞吐率有10倍左右提高.高效的中等规模数据排序是大规模数据排序的基础,这也是下一步将要研究的内容.

    排序优化FPGA层次化存储

    阵列众核处理器上的一种分区排序连接算法

    石嵩丁亚军李宏亮
    20-26页
    查看更多>>摘要:信息技术的发展使得数据查询和分析的实时性要求越来越高,而连接操作是数据库查询中最频繁、最耗时的操作之一,提高连接的效率很有必要.阵列众核处理器是众核处理器发展的一个重要方向,并已在高性能计算领域发挥了重要作用,将阵列众核处理器推广到数据密集型应用,如加速数据库操作有重要意义.本文基于阵列众核处理器的结构,对传统的排序合并连接进行了改进,设计了一种分区排序连接算法,算法通过将关系表划分成小表,避免了大量不必要的排序操作,减少了主存访问次数,有效提升了连接的性能.在异构融合阵列众核处理器DFMC(deeply-fused many-core)的实验表明,分区排序连接算法是一种高效的连接算法,其性能是DFMC上优化的排序合并连接算法的2.2倍,是CPU-GPU混合结构上散列连接算法的6.1倍.

    阵列众核连接数据库排序

    高性能众核处理器:性能功耗比驱动的设计方法

    王谛王梦嘉
    27-33页
    查看更多>>摘要:单芯片多处理器经过了十余年的发展,多核处理器和众核处理器的概念越发明晰,界限更加分明,众核处理器设计已经步入性能功耗比驱动的阶段.面对E级计算的需求,现有众核处理器的性能功耗比仍然存在差距,需要再提升一个数量级.本文从工艺和结构两个方面总结了处理器功耗的来源,整理了若干种主要的提高众核处理器性能功耗比的手段.

    众核处理器性能功耗比结构逻辑电路

    基于gem5模拟器的异构多核处理器指令集移植

    刘骁周培峰郑方丁亚军...
    34-39页
    查看更多>>摘要:在多核处理器的研究和设计中,体系结构模拟技术起着重要作用.异构结构与SIMD指令扩展日渐成为多核处理器领域的主流,面对这一趋势,相应的模拟技术成为国产处理器研制的必备条件.本文在多核体系结构模拟器gem5的基础上,针对由通用计算核心和精简运算核心组成的异构多核SIMD结构处理器,实现了对某国产RISC异构多核SIMD结构处理器的模拟支持,完成了在gem5上运算核心指令集的移植,以及SIMD模块和通用处理器核心功能相关模块的设计.测试结果表明移植的有效性和方案的可行性,为在其他处理器架构和开发环境下进行相应移植提供了参考.

    gem5SIMD异构多核处理器运算核心

    图计算模型中基于一致性要求的异步迭代研究

    孙茹君张鲁飞
    40-46页
    查看更多>>摘要:迭代计算是图计算的重要方面,随着数据规模的扩大,分布式/并行计算的规模也在逐渐扩大,异步迭代能够有效隐藏通信延迟,提高迭代效率.本文针对图计算中异步迭代的不同执行模式进行了综述,从理论和实践的角度分析了完全异步,以及在一致性和迭代轮数约束条件下,异步执行的收敛性和有效性.本文还对比了各种模型,并分析了不同约束条件下异步执行的适应性,同时针对模型的缺陷提出了解决思路.

    异步迭代异步一致性图计算

    InfiniBand网络探查技术研究

    建澜涛钱宇祝亚斌
    47-53页
    查看更多>>摘要:随着InfiniBand技术在高性能计算领域越来越广泛的应用,针对任意网络拓扑的InfiniBand网络探查技术也发挥着越来越重要的作用.本文对该技术的原理做了详细论述,并针对网络中完全未分配LID(Local Identifier)及部分分配LID这两种情况下,SM(Subnet Management)使用定向路由网络探查技术的具体实施过程做了详尽的研究.

    InfiniBand网络探查技术定向路由SM

    蜻蜓网络自适应路由算法实现解析

    高剑刚李瑛
    54-61页
    查看更多>>摘要:本文分析了Cray XC30系统蜻蜓网络自适应路由机制的实现流程和细节,重点对最小和非最小路由算法、分级路由表的组织结构、虚通道避免死锁等机制进行了深度解析,最后总结了蜻蜓网络中实现负载均衡且无死锁自适应路由的关键要点.

    蜻蜓网络自适应路由路由表虚通道负载均衡

    一种基于PIPE接口的PCIE设备直连方法

    韩文燕张琦滨
    62-66页
    查看更多>>摘要:PCIE架构的物理层接口规范(PIPE:PHY Interface for the PCI Express Architecture)是Intel公司开发的,专门针对PCIE物理层的接口规范.它在PCIE上层逻辑与PHY之间应用十分广泛,且已成为事实上的标准.本文简要介绍了PCIE规范的层次结构,深入分析了PIPE2.0接口的所有信号,提出了一种不经过PHY而将两个同为PIPE接口的PCIE部件直接互连的方法,较好地解决了多个PCIE IP核在芯片内的互连问题,且该方案的有效性已经某芯片流片验证.

    PCIE规范PIPE接口链路训练