首页期刊导航|计算机研究与发展
期刊信息/Journal information
计算机研究与发展
计算机研究与发展

徐志伟

月刊

1000-1239

crad@ict.ac.cn

010-62620696;62600350

100190

北京中关村科学院南路6号

计算机研究与发展/Journal Journal of Computer Research and DevelopmentCSCD北大核心CSTPCDEI
查看更多>>本刊是中国科学院计算技术研究所和中国计算机学会联合主办、科学出版社出版的学术性刊物、中国计算机学会会刊,我国第一个计算机刊物。主要刊登计算机科学技术领域高水平的学术论文、最新科研成果和重大应用成果。
正式出版
收录年代

    智能系统软件的机遇和挑战

    李国良
    963页

    机器学习方法赋能系统软件:挑战、实践与展望

    唐楚哲王肇国陈海波
    964-973页
    查看更多>>摘要:机器学习方法为构建系统软件带来了新的机遇.为充分利用硬件资源支撑新型应用,系统软件的设计与实现需要不断改进与演化,以适应不同场景的需求.机器学习方法具有从数据中提取规律并自动优化系统性能的潜力.然而,使用机器学习方法赋能系统软件面临一些挑战,包括设计面向系统软件的定制化模型、获取足量且高质量的训练数据、降低模型开销对系统性能的影响,以及消除模型误差对系统正确性的影响等.介绍了上海交通大学并行与分布式系统研究所在索引结构、键值存储系统、并发控制协议等方面应用机器学习方法优化系统软件的实践,并从模型设计、系统集成和实践者自身知识储备等方面总结了经验与教训.此外,还回顾了国内外相关研究,并对此研究方向提出了展望与建议,希望为未来的研究提供参考与帮助.

    机器学习系统软件索引结构键值存储并发控制

    前言

    陈铭松王泉郭兵邓庆绪...
    974-975页

    CPU-GPU MPSoC中使用寿命驱动的OpenCL应用调度方法

    曹坤龙赛琴李哲涛
    976-991页
    查看更多>>摘要:近年来,集成CPU和GPU的多处理器片上系统(multiprocessor system-on-chips,MPSoC),凭借兼顾GPU核心的并行计算能力和CPU核心的通用计算能力,已经广泛应用于工业控制、汽车电子、智慧医疗等领域.为了充分发挥CPU-GPU MPSoC的性能,开放计算语言(open computing language,OpenCL)逐渐成为一种主流的应用程序编写标准.然而,在将OpenCL应用部署到CPU-GPU MPSoC的过程中,现有研究工作大多忽略了对芯片温度和使用寿命的管理,导致处理器核心在执行应用时超过了峰值温度,甚至永久性故障的提前发生,无法保证OpenCL应用的长久稳定运行.为了弥补上述缺点,提出了一种包含静态和动态应用调度技术的方法.静态应用调度技术是基于改进交叉熵策略,将OpenCL应用的特性充分考虑在内,有效提高了OpenCL应用设计点的寻优效率.动态应用调度技术是基于反馈控制策略,克服了传统方案中无法有效应对系统运行时新到应用的缺陷,能够最小化新到应用的平均延迟.实验表明,所提方法可以将应用的平均延迟降低34.58%,同时满足温度、能耗、使用寿命的约束.

    CPU-GPU多处理器片上系统延迟寿命OpenCL应用调度温度

    异构多核全局限制性可抢占并行任务可调度分析

    韩美灵孙施宁邓庆绪
    992-1001页
    查看更多>>摘要:异构多核平台可以利用不同类别体系结构的处理器来执行特定任务,从而达到提高性能和降低功耗的 目的.然而,向大规模异构平台迁移极其困难,且大规模的、必要的程序并行会导致软件调度的复杂度.虽然,基于有向无环图(directed acyclic graph,DAG)并行任务模型已有相关的研究工作,但是基于DAG任务模型的限制性可抢占的调度策略研究仍存在不足.鉴于此,主要讨论了DAG任务在异构平台上进行全局固定优先级限制性可抢占调度时的最差响应时间(worst case response time,WCRT)分析,对并行任务的每个结点可用的处理器资源进行了一定的限制,即只能执行在规定类型处理器上的任务.基于最新的单分类并行任务的可调度性分析,提出了多个并行任务的可调度性分析.进一步,提出了高优先级任务的干涉量与低优先级任务的阻塞量的计算方法;结合最新的分类并行任务的任务内干涉计算方法,最终提出了一种伪多项式的分析方法.实验结果表明,提出的算法能够在合理的时间范围内得到任务集可调度性的分析结果,且任务集的接受率随各个参数的变化符合预期.

    响应时间分析异构多核并行任务模型嵌入式实时系统可调度性分析

    Mort:面向实时数据分发和传输优化的依赖性任务卸载框架

    殷昱煜苟红深李尤慧子黄彬彬...
    1002-1020页
    查看更多>>摘要:在边缘协同计算中,单一设备已无法满足大量复杂任务对系统高计算能力和低时延的需求,通常需要将任务卸载到邻近具有丰富计算存储资源的边缘服务器上,同时,通过发布订阅模式构建统一的通信协议,支撑任务对数据共享和隐私保护的需求.在发布订阅系统中,任务往往具有依赖性、执行周期性和高频率数据分发等特性,而传统的任务卸载算法主要针对数据单次传输和任务单次执行的场景,无法有效应对发布订阅系统中的任务卸载问题.因此,设计一个任务卸载及管理框架Mort.该框架使用基于静态代码分析的任务分解方法解构任务之间的依赖性,支撑任务并行;采用基于非线性整数规划建模和基于分组及资源融合的卸载算法,优化网络数据传输;采用基于协程的调度模型调度卸载后的任务,减少任务调度开销.大量的仿真实验和真实场景实验表明,Mort的数据传输优化能达到最优解的80%~90%,且引入的系统开销仅约为2%.

    边缘计算发布订阅系统依赖性任务卸载组合优化时间敏感

    实时计算机系统结构综述

    龚小航蒋滨泽陈香兰高银康...
    1021-1036页
    查看更多>>摘要:在时间敏感的嵌入式系统中,任务需要满足其最后截止期限,错失任务期限会显著影响服务质量或带来灾难性后果.与通用系统相比,实时系统研究进展缓慢,甚至很多基本概念都未达成共识.精确计时(precision timed,PRET)机和实时处理单元(real-time processing unit,RPU)是2套现有的实时系统解决方案,以它们为例介绍实时系统相关的概念,阐述实时系统发展中遇到的问题,比较异同,并分析实时系统各个层次遇到的问题和现有的解决方法.在应用层,用户需要定时操作的接口;在指令集架构(instruction set architecture,ISA)层,应充分利用硬件提供的资源,向上层提供足够的时间语义抽象和计时精度;硬件层需要支持ISA的时间属性和时间语义,并在保证实时性的基础上尽可能地提高性能.对实时系统的研究面临许多挑战.在现有的实时系统设计研究的过程中,关键问题在于上层应用的时间语义难以与底层实现保持一致.

    时间敏感系统时间属性时间语义实时机实时系统解决方案

    时间和能量敏感的端—边—云车路协同系统资源调度优化方法

    郑莹莹周俊龙申钰凡丛佩金...
    1037-1052页
    查看更多>>摘要:随着信息技术的不断发展,智能交通系统逐渐成为未来交通的发展方向.然而,智能交通系统中时间敏感型和计算密集型应用的日益增多,给资源有限的车辆终端带来了严峻挑战.端—边—云层次性计算架构是应对该挑战的有效手段.在基于端—边—云架构的车路协同系统中,车辆用户可以将时间敏感型任务卸载到附近的路边单元执行以保证应用的实时性,而将计算密集型任务卸载到云以满足其算力需求.但是,任务卸载也会导致额外的传输时延和能量开销.此外,任务在传输过程也可能遭受错误而导致可靠性降低.因此,为保障端—边—云车路协同系统中车辆的用户体验,提出一种基于多智能体强化学习的资源调度方案.该方案通过充分利用端—边—云架构的特点并采用集中训练—分散执行的框架来构建深度神经网络,以制定任务卸载和车路计算资源分配的最优决策,最终实现可靠性约束下的系统时延和能耗优化.为验证所提方案的有效性,实验通过效用值来体现算法在时延和能耗2方面的优化.实验结果表明,与现有算法相比,所提方案在满足可靠性约束的前提下,效用值可以提高到221.9%.

    车路协同系统端—边—云卸载调度强化学习

    SAF-CNN:面向嵌入式FPGA的卷积神经网络稀疏化加速框架

    谢坤鹏仪德智刘义情刘航...
    1053-1072页
    查看更多>>摘要:传统的卷积神经网络加速器及推理框架在资源约束的FPGA上部署模型时,往往面临设备种类繁多且资源极端受限、数据带宽利用不充分、算子操作类型复杂难以适配且调度不合理等诸多挑战.提出一种面向嵌入式FPGA的卷积神经网络稀疏化加速框架(sparse acceleration framework of convolutional neural network,SAF-CNN),通过软硬件协同设计的方法,从硬件加速器与软件推理框架2个角度进行联合优化.首先,SAF-CNN构建并行计算阵列,并且设计并行编解码方案,实现单周期多数据的传输,有效减少通信代价.其次,设计细粒度结构化块划分剪枝算法,于输入通道维度进行块内裁剪来获得稀疏且规则的权重矩阵,借此显著降低计算规模和DSP乘法器等资源占用.然后,提出一种兼容深度可分离卷积的输入通道维度动态拓展及运行时调度策略,实现输入通道参数灵活适配与逐通道卷积和逐点卷积的资源复用.最后,提出一种计算图重构及硬件算子融合优化方法,提升硬件执行效率.实验采用2种资源受限的低端FPGA异构平台Intel CycloneV与Xilinx ZU3EG,结果表明SAF-CNN加速器可分别实现76.3GOPS与494.3GOPS的计算性能.与多核CPU相比,SAF-CNN在进行SSD_MobileNetV1目标模型检测时,可实现3.5倍与2.2倍的性能提升,模型推理速度高达26.5fps.

    卷积神经网络模型压缩计算图加速器设计推理框架

    面向边缘计算的服务解耦与部署策略

    李丽颖张润泽魏同权
    1073-1085页
    查看更多>>摘要:在这个万物互联的时代,海量的设备和数据、云和设备之间存在巨大的传输延迟,给开发应用、处理数据、最终提升系统的服务质量带来了多重挑战.因此,通过在终端设备附近部署计算能力以显著减少传输到云服务器的数据量和服务请求的响应时间的边缘计算结构应运而生.然而,负载均衡、边缘设备的安全性和移动性依旧是影响边缘计算架构的服务质量的关键点.为了解决上述问题,提出了一种2阶段的服务质量优化方案以解决移动边缘计算架构下的服务部署问题.在第1阶段,考虑了服务的解耦和边缘服务器的负载均衡问题,对服务部署问题进行建模,提出了一种集中式服务的实时解耦方案,并且设计了一种静态部署策略;在第2阶段,考虑了边缘设备的移动性,设计了一种设备移动感知的服务动态部署策略,优化了移动边缘计算架构下的服务质量.在2个数据集上的实验结果表明,所提出的静态部署策略能够使服务请求的响应时间降低36%,所提出的动态部署策略能进一步降低13%的服务响应时间.

    边缘计算服务质量响应时间服务解耦服务部署