首页期刊导航|计算机研究与发展
期刊信息/Journal information
计算机研究与发展
计算机研究与发展

徐志伟

月刊

1000-1239

crad@ict.ac.cn

010-62620696;62600350

100190

北京中关村科学院南路6号

计算机研究与发展/Journal Journal of Computer Research and DevelopmentCSCD北大核心CSTPCDEI
查看更多>>本刊是中国科学院计算技术研究所和中国计算机学会联合主办、科学出版社出版的学术性刊物、中国计算机学会会刊,我国第一个计算机刊物。主要刊登计算机科学技术领域高水平的学术论文、最新科研成果和重大应用成果。
正式出版
收录年代

    云原生驱动的大规模终端网络设计优化和应用实践

    罗军舟
    1页

    大规模复杂终端网络的云原生强化设计

    李振华王泓懿李洋林灏...
    2-19页
    查看更多>>摘要:作为互联网数据传输的"最后一公里",终端网络看似简单却构成 99%的性能瓶颈.经典设计面向典型设备常规环境,难以兼顾多样化场景,导致严重性能落差.通过云端汇聚并深度诊断大规模终端网络异常,在可用、可靠、可信 3个关键维度揭示经典设计多处重要缺陷,采用跨层跨代的协同强化方法针对性修复(如时变非齐次 4G/5G双连接管理方法最小化断网概率),实现无场景预设的自调控机制设计.应用于公安部高速网络、1 700万"测网速"app用户、七千万小米手机、一亿百度手机卫士用户以及九亿WiFi设备.近年来进一步开展基于云端模拟器的前瞻网络设计,无需真实用户设备参与即可发现并修复潜在缺陷,让终端网络设计"生于云、长于云".研究成果应用于华为DevEco Studio集成开发环境、腾讯应用市场、谷歌安卓模拟器及字节跳动多款流行应用(如抖音和今日头条).

    终端网络网络测量网络设计云原生网络模拟

    图计算体系结构和系统软件关键技术综述

    张宇姜新宇余辉赵进...
    20-42页
    查看更多>>摘要:图计算作为分析事物之间关联关系的重要工具,近年来已成为各国政府及公司争夺的关键技术.学术界和工业界在图计算体系结构和系统软件关键技术方面取得了一定进展.然而,现实场景图计算大多具有动态变化、应用需求复杂多样等特征.这给图计算在基础理论、体系架构和系统软件关键技术方面提出了新的需求,同时也带来了新的挑战.为应对这些挑战,科研人员提出了一系列图计算系统或图计算加速器,通过高性能计算、并行计算等技术来优化图计算过程.综述国内外图计算体系结构和系统软件关键技术的研究发展现状,对国内外研究的最新进展进行归纳、比较和分析,并结合国家发展战略和重大应用需求,选取与我国国计民生密切相关的领域,从典型应用分析总结图计算相关技术的行业进展.最后,就未来的技术挑战和研究方向进行展望.

    图计算体系结构系统软件图遍历图挖掘图神经网络单机系统分布式系统加速器行业应用

    面向多应用混部的性能保障方法综述

    郭静胡存琛包云岗
    43-65页
    查看更多>>摘要:数据中心的高投入和低资源利用率一直是云服务提供商关注的问题.面对这个难题,直接的解决方案是在同等资源上混合部署更多的应用以提高资源使用效率.然而,由于混部应用对共享资源的竞争导致了应用间的性能干扰,从而影响了应用的性能、服务质量(quality of service,QoS)和用户满意度,因此如何保障应用的性能已成为混部场景下的关键问题.着重从应用和集群特征分析(基础)、干扰检测(前提)、单节点资源分配(微观层面策略)和集群作业调度(宏观层面策略)4个方面阐述多应用混部性能保障的相关背景、挑战和关键技术.在不同的混部场景下,由于应用和集群特征等不同,性能保障工作所面临的挑战和问题复杂度也各异,例如单位资源上混合部署的应用数量会直接影响到搜索资源空间的时间开销,应用的运行方式会影响到共享资源的竞争强度.因此,从问题复杂度角度出发,从应用和集群特征、资源干扰维度和混部应用个数 3个维度对相关研究工作面临的挑战进行讨论和分析.探讨了面向高密度混部场景应用性能保障方法的发展方向和挑战,认为全栈式的软硬件协同方法是保障高密度混部下应用性能的趋势,该方法有助于全面地提升应用性能的可靠性和数据中心的资源利用率.

    混部性能保障服务质量资源共享资源隔离干扰检测资源管理作业调度

    面向申威众核处理器的规则处理优化技术

    张振东王彤刘鹏
    66-85页
    查看更多>>摘要:高性能口令恢复系统是申威众核处理器的重要应用场景之一,规则处理是主流口令恢复工具中被广泛应用的一种口令生成方式.现有相关研究工作缺少对规则处理算法的优化,导致申威处理器上基于规则的口令生成速度成为口令恢复系统的性能瓶颈.通过分析规则处理算法的多层次可并行性,提出了面向申威众核处理器的线程级、数据级优化方案.在线程级优化方案中,探索了规则处理算法的最优任务映射方式,设计了主从核任务分配机制、从核缓冲区配比优化机制、负载均衡机制、变长规则存储机制等技术以提高并行效率;在数据级优化方案中,分析了规则处理算法中规则函数的计算模式,并通过申威SIMD指令集对规则函数进行向量优化以提高执行效率.在SW26010处理器上的实验结果表明,上述优化方案有效解除了规则处理的性能瓶颈,使规则模式下的口令恢复速度提升了30~101倍.

    申威众核处理器口令恢复规则处理异构计算单指令多数据流

    神威超级计算机运行时故障定位方法

    高剑刚郑岩于康彭达佳...
    86-97页
    查看更多>>摘要:随着高性能计算机的性能不断提升、系统规模不断提高,系统和应用的错误率也不可避免地持续增多.快速发现和定位系统及应用级的错误、为用户提供高质量服务,成为了超级计算机系统设计开发过程中急需考虑的问题.超级计算机系统中硬件故障与异常、软件程序的错误等都会导致用户大规模并行应用的错误、挂死与退出.如何快速准确定位错误现场,让管理员或用户以此为基础查看异常发生的故障进行高精度、高效率的诊断,是维护高性能计算系统可靠性的重要基础.高性能计算机传统的故障定位主要通过硬件异常跟踪、系统日志分析和程序主动探测等方法,缺乏对无日志信息、无明显故障现象的程序挂死问题的定位手段,并且技术的扩展性也面临挑战.针对"新一代神威超级计算机"体系结构和SW26010-Pro众核处理器特点,提出一种运行时故障定位方法,包括基于消息传递的故障关联分析、基于全局聚合信息的在线综合分析诊断、面向申威众核处理器的异常线程过滤方法等关键技术,阐述了如何有效检测、收集、处理大量系统资源和并行进程的异常信息问题,为应对未来超大规模高性能计算中故障高效定位难题提供有效支撑.

    E级计算机可靠性错误定位运行时众核处理器

    基于RPU的TTI程序设计和分析方法

    高银康陈香兰龚小航蒋滨泽...
    98-119页
    查看更多>>摘要:实时嵌入式系统不仅要保证计算结果的逻辑正确性,还要确保与外界交互的时序正确性,所以底层程序要能精确表达上层模型中的时间行为.TTI指令集(time-triggered instruction set)的提出尝试解决计算机指令集体系结构层次缺少时间语义的问题,并且基于TTI指令集实现的实时处理单元(real-time processing unit,RPU)证明了TTI指令集的可行性和有效性.但是目前的工作缺少对于TTI程序设计和分析方法的研究.所以,基于TTI指令集和RPU,提出了TTI指令集可以表达的 4种时间语义,给出了TTI程序的设计范式.并且构建了TTI程序时间行为的表示方法——TFG+,TFG+是对TFG的扩展,TFG+区分了TTI程序中时间语义指令和普通代码段,可以表示TTI程序的控制流信息、用户规定的时间行为和TTI程序平台相关的时间属性.最后,提出了TTI程序的时间分析方法以及时间安全性检查方法,为TTI程序的设计和部署提供了依据.

    实时嵌入式系统时间可预测性时间语义指令集实时处理器WCET分析

    通用域适应综述

    何秋妍邓明华
    120-144页
    查看更多>>摘要:域适应问题放宽了传统机器学习问题关于训练样本和测试样本同分布的假设,在域间差异存在的情况下从富有标签的源域迁移知识到缺少标签的目标域.但现有域适应方法大多依赖于对源域和目标域标签集合的相对关系的假设,不贴合实际应用场景,因此,通用域适应问题考虑如何在缺少源域和目标域的标签集合先验信息的情况下,实现对目标域的标记.在此过程中,通用域适应方法需要判定目标域样本是否属于源域类别,克服域间差异和潜在的类别差异,在源域和目标域共有类上完成标签的迁移.首先从问题设置与方法策略 2方面,对通用域适应方法进行梳理;然后通过实验对比了典型方法,进而分析了通用域适应问题的研究难点;随后整理了现有方法的应用情况,对与之有关的实际应用问题进行了分析;最后探讨了通用域适应问题未来研究方向.

    通用域适应迁移学习对抗学习对比学习自训练

    基于深度强化学习的掼蛋扑克博弈求解

    葛振兴向帅田品卓高阳...
    145-155页
    查看更多>>摘要:在不确定信息的复杂环境下进行决策是现实中人们经常面对的困难之一,因此具有能够进行良好决策的能力被视为人工智能的重要能力之一.而游戏类型的博弈作为对现实世界的一种高度抽象,具有良定义、易检验算法优劣等特点,成为研究的主流.其中以掼蛋为代表的扑克类博弈不仅具有他人手牌未知这样的难点,还由于可选出牌动作与他人手牌情况数量庞大等特点,难以进行高效求解.因此,提出了一种软深度蒙特卡洛(soft deep Monte Carlo,SDMC)求解方法.该方法能够更好地融合领域知识,加快策略学习速度,并采用软动作采样策略调整实时决策,提升策略胜率.所提出的SDMC方法训练出的策略模型参加第 2届"中国人工智能博弈算法大赛"时获得冠军.与第 1届比赛冠军策略和第 2届其他策略模型的实验对比证明了该方法在解决掼蛋扑克博弈中的有效性.

    非完美信息深度强化学习多智能体系统软深度蒙特卡洛方法扑克博弈

    多项正则化约束的伪标签传播优化脑电信号聚类

    代成龙李光辉李栋申佳华...
    156-171页
    查看更多>>摘要:作为一种非侵入式分析载体,脑电信号目前被广泛应用于脑-机接口、医疗辅助诊断及康复领域,但这些应用通常依赖需要完整标签的有监督分析技术,如分类.随着无标签脑电信号的与日俱增,现有的有监督方法不能有效解决无标签脑电信号分析问题,也在一定程度上限制了无标签脑电信号这类新型数据的应用拓展.为了解决无标签脑电信号的无监督分析问题,提出了一种基于多项正则化约束的伪标签传播优化聚类模型.该模型通过同时优化学习伪标签传播矩阵、脑电信号相似度邻接矩阵、标签分类器的方式实现聚类.将提出的脑电信号聚类模型转化为一个多目标优化问题,并提出了一种基于梯度下降策略的聚类算法EEGapc(electroencephalogram clustering with pseudo label propagation).该算法不仅充分考虑了脑电信号之间的相关性及脑电信号间的信息传递,还能快速收敛到局部最优.在 14个真实脑电信号数据集上的实验结果表明,提出的EEGapc脑电信号聚类算法比现有的 8种聚类算法性能更好,且在平均NMI(normalized mutual information),ARI(adjusted rand index),F-score,kappa 这 4个指标上,EEGapc与现有的 8种聚类算法相比,分别至少提升了86.88%,58.01%,6.29%,61.17%.

    脑电信号聚类伪标签传播邻接矩阵优化伪标签分类器多目标优化