首页期刊导航|计算机研究与发展
期刊信息/Journal information
计算机研究与发展
计算机研究与发展

徐志伟

月刊

1000-1239

crad@ict.ac.cn

010-62620696;62600350

100190

北京中关村科学院南路6号

计算机研究与发展/Journal Journal of Computer Research and DevelopmentCSCD北大核心CSTPCDEI
查看更多>>本刊是中国科学院计算技术研究所和中国计算机学会联合主办、科学出版社出版的学术性刊物、中国计算机学会会刊,我国第一个计算机刊物。主要刊登计算机科学技术领域高水平的学术论文、最新科研成果和重大应用成果。
正式出版
收录年代

    ROS2多线程执行器上DAG任务的优先级分配方法

    纪东魏阳杰李宇溪王义...
    1086-1098页
    查看更多>>摘要:随着机器人操作系统(robot operating system,ROS)的日益普及,系统也变得更加复杂,这类系统的计算平台正逐渐转变为多核心平台.在ROS中,任务执行的顺序取决于底层任务调度策略和分配给任务的优先级,而最大限度地缩短所有任务的执行时间是并行系统任务调度的一个重要目标.受强化学习在解决各种组合优化问题的最新研究成果的启发,在考虑ROS2多线程执行器的调度机制和执行约束的前提下,提出了一种基于强化学习的任务优先级分配方法,该方法提取了基于有向无环图形式表示的任务集的时间和结构特征,通过策略梯度和蒙特卡洛树搜索(Monte Carlo tree search,MCTS)方法有效地学习ROS2调度策略并给出合理的优先级设置方案,最终达到最小化并行任务的最大完工时间的目的.通过模拟平台环境下随机生成的任务图以评估所提方法,结果表明所提方法明显优于基准方法.作为一种离线分析方法,所提方法可以很容易地扩展到复杂的ROS中,在可接受的时间内找到接近最优的解决方案.

    机器人操作系统强化学习DAG任务优先级分配蒙特卡洛树搜索

    基于公共情感特征压缩与融合的轻量级图文情感分析模型

    甘臣权付祥冯庆东祝清意...
    1099-1110页
    查看更多>>摘要:由于图文结合更能反映用户的态度和立场,图文情感分析已成为研究热点之一.然而,现有图文情感分析方法无法有效地提取融合图文信息,致使模型性能低、参数量大、不易部署.对此,提出了一种基于公共情感特征压缩与融合的轻量级图文情感分析模型.该模型结合卷积层和全连接层设计的图文特征压缩模块在提取图文特征的同时也进行了压缩,降低了特征维度.此外,提出了一种基于门控机制的公共情感特征融合模块,将图文特征映射到相同的情感空间,消除了图文特征间的异构性,通过提取、融合图像和文本的公共情感特征,减少了冗余信息.在Twitter,Flickr,Getty Images这3个基线数据集上的实验结果表明:所提模型比早期模型更有效地提取融合了图文情感信息;和最新模型相比,所提模型大大减少了模型参数并具有更优越的性能,更易部署.

    图文情感分析公共情感特征特征压缩特征融合轻量级

    利用混杂核模糊补互信息选择特征

    袁钟陈红梅王志红李天瑞...
    1111-1120页
    查看更多>>摘要:模糊粗糙集理论目前在数据挖掘和机器学习等领域受到了广泛的关注.该理论提供了一种能克服离散化问题的有效工具,并能直接应用于数值或混合属性数据.在模糊粗糙集模型中,定义模糊关系来测量对象之间的相似性,数值属性值不再需要离散化.模糊粗糙集理论已经被成功应用于许多领域,如属性约简、规则提取、聚类分析和离群点检测.信息熵被引入到模糊粗糙集理论进行模糊和不确定信息的表示,产生了不同形式的模糊不确定性度量,如模糊信息熵、模糊补熵和模糊互信息等.然而,大部分所提关于决策的模糊互信息都是非单调的,这可能导致一个不收敛的学习算法.为此,基于混杂核模糊补熵,定义了关于决策的模糊补互信息,证明了其随特征呈单调性变化.进而,利用混杂核模糊补互信息探索特征选择方法并且设计了相关的算法.实验结果展示了在大多数情况下所提算法可以选取更少的特征且能保持或提高分类准确率.

    模糊粗糙集理论混杂核补熵不确定性度量特征选择

    基于图神经网络的OpenCL程序自动优化启发式方法

    叶贵鑫张宇翔张成赵佳棋...
    1121-1135页
    查看更多>>摘要:物联网的发展与普及促使计算机异构架构迅速发展,开放运算语言(open computing language,OpenCL)作为首个跨平台异构并行计算框架,具有标准化、可移植性等优点,但因不同平台下软硬件的复杂性和多样性,使OpenCL在性能上的移植性存在一定的缺陷.现有的方法通过深度学习构建优化模型来提高程序运行效率,但所构建的预测模型仅考虑代码的顺序依赖关系,忽略了语法语义信息,导致代码优化效果不明显.为解决上述问题,提出了一种基于多关系图神经网络的OpenCL程序自动优化启发式方法.该方法首先把OpenCL代码转换成多关系代码图,能够提取代码的深度结构与语法语义特征;然后利用改进后的图神经网络模型,将构建的代码图编码为高维的特征向量;最后使用决策网络完成任务预测.为验证方法的有效性,分别在异构设备映射和线程粗化因子预测2个任务上进行实验评估.结果表明,在异构设备映射任务中,最优设备预测准确率能够达到88.7%,相较于现有最先进的方法,加速比可提高7.6%;在线程粗化任务中,加速比相较于现有最优的方法可提高5.2%.

    启发式优化图网络OpenCL深度学习异构设备

    基于混合计数布隆过滤器的高效数据名查找方法

    许可李彦彪谢高岗张大方...
    1136-1150页
    查看更多>>摘要:数据名查找是信息中心网络、内容分发网络、5G核心网中基础功能组件的关键操作,需要面向大规模规则表进行最长前缀匹配,在查找速度、更新开销和存储开销等方面面临严峻挑战.首先设计了混合计数布隆过滤器(HyCBF),将数据名前缀和前缀标记维护在同一个计数布隆过滤器中同时保持二者的逻辑独立性.这样可在不增加额外存储开销和时间开销的情况下提供更丰富的指示信息.基于此,提出HyCBF辅助的二分数据名查找(HyBS)方法以实现高效查找.进一步,为缓解二分查找过程中因回溯导致的性能损失,为HyCBF中每个条目关联一个特征比特位图以降低其假阳性率.实验表明,HyBS相比现有方法在查找性能和更新速度方面具有明显优势,存储效率也有一定提升.此外,将HyBS集成到向量化数据包处理(VPP)框架中进行系统性能评估,结果表明HyBS可用于构建高通量可扩展的数据名查找引擎.

    数据名查找特征比特位图计数布隆过滤器二分搜索向量化数据包处理

    基于资源需求预测的动态服务功能链迁移方法

    阳勇孟相如康巧燕陈港...
    1151-1163页
    查看更多>>摘要:针对网络功能虚拟化环境下服务功能链资源需求变化引起的底层网络过载问题,提出一种基于资源需求预测的动态服务功能链迁移方法.首先,综合考虑迁移开销和迁移后底层网络的资源占用情况,建立底层网络开销模型.其次,利用经验模态分解将资源需求序列分解成本征模函数分量与残差分量,再通过径向基函数神经网络实现对各分量的预测,神经网络的训练过程采用粒子群算法进行参数优化.最后,对下一时隙即将过载的物理节点或链路,选择对过载资源占用最多的虚拟网络功能或虚拟链路进行迁出,并基于流量优化的原则,通过对全局拓扑的感知选择能最小化底层网络开销的物理节点迁入.仿真实验表明,所提的资源需求预测模型在提高预测精度的同时能缩短预测时间,所提的服务功能链迁移方法在降低底层网络开销、减少端到端时延和提高服务功能链可靠性等方面有较好性能.

    网络功能虚拟化服务功能链虚拟网络功能资源需求预测径向基函数

    针对冗余零的跨平台细粒度性能分析技术

    游心杨海龙雷克伦孔祥浩...
    1164-1176页
    查看更多>>摘要:冗余零造成的软件低效行为会导致大量的0值被读取甚至被用来重复地进行无用的计算,从而导致内存、计算资源的浪费.然而,现有的编译器工具链都不能够有效地识别并消除应用程序中0值相关的冗余操作,且冗余零相关的硬件优化方法仍然没有应用于商业处理器中.虽然ZeroSpy能够识别冗余零并提示足够的信息来指导优化,但其检测方法仍然局限于Intel平台,且其过大的性能开销阻碍了更加广泛的使用.针对冗余零的跨平台细粒度性能分析工具DrZero则可以克服上述限制.DrZero支持x86和ARM平台,并实现在线细粒度缓存迹分析来减少性能开销.为了支持ARM平台,基于数据流分析的数据类型推断方法可以自动推断内存读取值的数据类型.经过评测,DrZero的以代码、数据为中心的分析模式可以在x86和ARM平台上分别以平均45.31倍、54.20倍和14.12倍、13.40倍的性能开销识别冗余零并给出优化建议.此外,在x86平台上与ZeroSpy所报告的性能开销相比,DrZero的平均性能开销分别在以代码、数据为中心的分析模式下降低了37.2%,55.8%.基于DrZero给出的性能优化指导,应用程序优化后在x86和ARM上分别达到了最高1.76倍和2.12倍的性能加速.DrZero的实现代码已经开源:https://github.com/buaa-hipo/zerospy-drcctprof.

    二进制插桩冗余零软件低效行为性能分析与优化跨平台

    大规模海洋数据同化的并行优化

    蔡迪洪学海肖俊敏谭光明...
    1177-1190页
    查看更多>>摘要:海洋数据同化是一种同时利用海洋观测资料和海洋数值模式对海洋数据进行修正的有效方法,经过处理的海洋数据更加接近海洋的真实情况.在高分辨率下,基于中国科学院大气物理研究所(Institute of Atmospheric Physics,Chinese Academy of Sciences,IAP)和大气科学和地球流体力学数值模拟国家重点实验室(State Key Laboratory Modelling for Atmospheric Sciences and Geophysical Fluid Dynamics,LASG)发展的LASG/IAP气候系统海洋模式(LASG/IAP climate ocean model,LICOM)的同化并行程序往往涉及大量的文件读取、通信和计算,以往的研究虽然对这些方面进行了优化,但是由于优化只是停留在上层算法层面,没有考虑底层的文件系统以及超算集群的架构,因此优化的效果不太明显.针对以往研究存在的问题,进一步将海洋数据同化的数据特性、计算特性与所使用的超算平台的架构特性相结合,在此基础上结合时间局部性和空间局部性,提出了基于计算拓扑图的负载均衡策略、基于Lustre文件存储架构和超算集群特性的并行优化策略,以及计算、读取通信、写回3层重叠策略.最后,使用高分辨率数据集,在天河2号超算集群上对所提算法进行了测试.相比于现有算法,所提的算法在4000核下对总体同化性能上提升了18倍.另外,还在曙光7 000超算集群上开展了测试.在4000块DCU加速卡上,相比于已有算法,所提算法提升总体计算性能8倍左右.

    数据同化负载均衡I/O优化并行优化计算与通信重叠