首页期刊导航|计算机研究与发展
期刊信息/Journal information
计算机研究与发展
计算机研究与发展

徐志伟

月刊

1000-1239

crad@ict.ac.cn

010-62620696;62600350

100190

北京中关村科学院南路6号

计算机研究与发展/Journal Journal of Computer Research and DevelopmentCSCD北大核心CSTPCDEI
查看更多>>本刊是中国科学院计算技术研究所和中国计算机学会联合主办、科学出版社出版的学术性刊物、中国计算机学会会刊,我国第一个计算机刊物。主要刊登计算机科学技术领域高水平的学术论文、最新科研成果和重大应用成果。
正式出版
收录年代

    车计算——自动驾驶研究前沿展望

    邢国良
    1页

    车计算:自动驾驶时代的新型计算范式

    鲁思迪何元恺施巍松
    2-21页
    查看更多>>摘要:随着边缘计算、传感、人工智能和通信技术的迅猛发展,车辆正经历前所未有的深刻变革.提出了一种适用于自动驾驶时代的全新计算范式——车计算.在这一新型范式下,车辆的数据层与控制层被分离,车辆系统转向开放的计算平台,构建了支持多方协作的数据共享结构,从而打破了传统车辆系统的封闭局限,使车辆从单一的交通工具演变为支持丰富的高级应用和第三方服务的多功能移动计算平台.全面阐述了车计算范式的核心理念,深入分析了车辆软件与计算架构的革命性演进,提供了具有应用前景的车计算实例,并介绍了在该范式支持下具有颠覆潜力的新型商业模式.此外,深入探讨了车计算的五大核心功能:计算、通信、能源管理、传感和数据存储,以及相关的前沿技术.最后,总结了车计算领域的关键技术挑战和广阔的机遇,期望能够激发学术界和工业界对这一创新领域的深入研究与高度关注.

    车计算自动驾驶计算通信能源管理移动感知数据存储软件自定义车辆

    面向处理器微架构设计空间探索的加速方法综述

    王铎刘景磊严明玉滕亦涵...
    22-57页
    查看更多>>摘要:中央处理器是目前最重要的算力基础设施.为了最大化收益,架构师在设计处理器微架构时需要权衡性能、功耗、面积等多个目标.但处理器运行负载的指令多,单个微架构设计点的评估耗时从 10 min到数十小时不等.加之微架构设计空间巨大,全设计空间暴力搜索难以实现.近些年来许多机器学习辅助的设计空间探索加速方法被提出,以减少需要探索的设计空间或加速设计点的评估,但缺少对加速方法的全面调研和系统分类的综述.对处理器微架构设计空间探索的加速方法进行系统总结及分类,包含软件设计空间的负载选择、负载指令的部分模拟、设计点选择、模拟工具、性能模型 5类加速方法.对比了各加速方法内文献的异同,覆盖了从软件选择到硬件设计的完整探索流程.最后对该领域的前沿研究方向进行了总结,并放眼于未来的发展趋势.

    处理器微架构设计设计空间探索性能模型负载选择软件模拟

    移动设备日志结构文件系统综述

    杨梨花董勇邬会军谭支鹏...
    58-74页
    查看更多>>摘要:NAND闪存(NAND flash)因为其大容量、轻便、抗震等优异特性,被广泛使用于移动设备.面向闪存特性设计的闪存友好型文件系统(flash friendly file system,F2FS)是典型的日志结构文件系统(log-structured file system,LFS),它采用日志结构写机制提升了随机写性能,使用前滚恢复技术实现快速的一致性保护,经常被用作移动设备的文件系统.文件系统因碎片化和段清理问题导致性能下降,而日志结构文件系统的异地更新机制和移动应用的高并发随机同步小写模式进一步加剧了碎片化,导致I/O请求响应变慢、设备运行卡顿.首先介绍了移动设备日志结构文件系统的相关概念和内容,随后总结了日志结构文件系统碎片化和段清理问题的研究现状.一方面分析了碎片产生的原因与影响,从预防碎片产生和重整碎片 2个角度总结了减少碎片的研究工作.另一方面分析了冷热数据混合对段清理的影响,从静态分类和动态分类 2方面总结了冷热数据区分技术的研究现状,从管理数据分布和调整段清理时机、频率、对象2个角度总结了段清理的研究现状.最后展望了移动设备日志结构文件系统研究的主要挑战和未来研究工作.

    日志结构文件系统移动存储文件碎片空闲空间碎片段清理冷热数据区分

    混洗SRAM:SRAM中的并行按位数据混洗

    张敦博曾灵灵王若曦王耀华...
    75-89页
    查看更多>>摘要:向量处理单元(vector processing unit,VPU)已被广泛应用于神经网络、信号处理和高性能计算等处理器设计中,但其总体性能仍受限于专门用于对齐数据的混洗操作.传统上,处理器使用其数据混洗单元来处理混洗操作.然而,使用数据混洗单元来处理混洗指令将带来昂贵的数据移动开销,并且数据混洗单元只能串行混洗数据.事实上,混洗操作只会改变数据的布局,理想情况下混洗操作应在内存中完成.随着存内计算技术的发展,SRAM不仅可以作为存储部件,同时还能作为计算单元.为了实现存内混洗,提出了混洗SRAM,它可以在SRAM体中逐位地并行混洗多个向量.混洗SRAM的关键思想是利用SRAM体中位线的数据移动能力来改变数据的布局.这样SRAM体中位于同一位线上不同数据的相同位可以同时被移动,从而使混洗操作拥有高度的并行性.通过适当的数据布局和向量混洗扩展指令的支持,混洗SRAM可以高效地处理常用的混洗操作.评测结果表明,对于常用的混洗操作,混洗SRAM可以实现平均 28倍的性能增益,对于FFT,AlexNet,VggNet等实际的应用,可以实现平均 3.18倍的性能增益.混洗SRAM相较于传统SRAM的面积开销仅增加了4.4%.

    向量单指令多数据体系结构静态随机访问存储器混洗操作向量内存存内计算

    面向分布式图计算的图划分技术综述

    尚俊霖张振宇屈稳稳王晓玲...
    90-103页
    查看更多>>摘要:图结构作为表达事物之间复杂关联的数据结构,被广泛使用在多种应用场景中.随着互联网应用的不断发展,数据规模的不断增加,分布式的图计算系统相较于传统单机系统从运算时间、资源调度等各个方面显现出优越的性能.近年来,基于大规模图数据的分布式图计算系统使用需求快速增加,图数据划分技术受到了学术界的广泛关注.通过对分布式图计算系统中的图划分技术的研究,首先介绍了面向分布式图计算的图划分的技术背景,给出当前分布式图计算系统中的图划分相关概念的定义以及相关计算模型的分类体系,报告了分布式图计算模型的发展现状.接着对不同的图划分策略中的具体技术进行介绍,通过在不同策略之间进行分析与比较,总结其在各类分布式图计算系统中的优势与不足.最后就分布式图计算系统中图划分技术的发展现状,讨论了其当前存在的挑战与未来的研究方向.

    图划分图数据分析与管理图计算分布式图系统超图划分

    反馈集与子集反馈集问题的计算复杂性研究进展

    白天肖鸣宇
    104-118页
    查看更多>>摘要:反馈集问题(feedback set problem)是计算机科学中研究最为广泛和深入的图上NP完全问题之一,其在并发计算、大规模集成电路、编码设计、软件验证、社交网络分析等领域均存在重要的应用.子集反馈集问题(subset feedback set problem)是反馈集问题的一种更一般化的形式,更加具有普适性和实用性.近年来,这 2个问题在计算复杂性上的分类工作已逐步完善,在算法领域也已出现许多重要的突破.相关研究工作分为 2个部分进行介绍.第 1部分详尽地介绍了反馈集和子集反馈集各种不同版本的问题,梳理了它们之间的一些重要关系,并介绍了这些问题在一般图上的计算复杂性.第 2部分系统性地介绍了反馈集和子集反馈集问题在一些重要子图类上的计算复杂性,包括度有界的图类、平面图类、竞赛图图类、相交图类、禁止图图类和二部图图类.最后对反馈集和子集反馈集问题的研究现状进行分析和总结,概括了目前主流的研究趋势.

    反馈集问题子集反馈集问题图论计算复杂性图算法

    生物序列比对动态规划算法的统一形式化构造与Isabelle验证

    石海鹤蓝孙文刘日明石海鹏...
    119-131页
    查看更多>>摘要:序列比对是生物序列分析中的一个经典问题,旨在找出序列之间的相似性,它对于发现生物序列中的功能、结构和进化信息都具有重要的意义.该问题可分为双序列比对和多序列比对 2类,现有工作多针对特定算法展开,没有设计通用的求解方法;此外,甚少涉及算法可信性的研究.从生物序列比对问题的形式化规约出发,通过深入分析问题的性质,刻画问题求解的本质特征,借助形式化方法PAR(partition and recursion)设计了序列比对动态规划算法的统一构造框架seqAlign;展示了应用该框架构造序列数为3的多序列比对算法的过程,并使用Isabelle定理证明器对构造结果进行形式化验证;利用PAR平台生成了该算法的C++可执行程序,进一步分析了由seqAlign框架机械化构造其他类型序列比对算法的过程.通过严密的规约精化和形式验证,有效地保证了生成算法的可信性;开发的seqAlign框架提供了序列比对问题类的通用求解方案,显著提高了序列比对算法族生成的效率.研究结果在生物序列分析中序列比对问题上的成功应用,从方法学和实践上可为复杂生物信息学领域高可靠算法的构造提供参考.

    序列比对PAR方法形式构造Isabelle定理证明器

    基于对比学习和标签挖掘的点云分割算法

    黄华卜一凡许宏丽王晓荣...
    132-143页
    查看更多>>摘要:基于深度学习的点云分割算法通过设计复杂的特征提取模块,可以对高维空间点云进行有效的分割.但由于缺乏对边界点集的特征挖掘,使得其对边界分割的精度欠佳.已有将对比学习思想用于点云分割以解决边界区域分割性能不足问题的研究中,忽略了点云无序和稀疏特性,特征提取不够准确.对此,设计了基于对比学习和标签挖掘的点云分割模型CL2M(contrastive learning label mining),通过自注意力机制学习不同位置处点云更为精准的特征,并引入对比学习方法,提高了点云边界处的分割精度.在对比边界学习过程中通过深入挖掘语义空间中的标签并设计了基于标签分布的对比边界学习模块,使得高维空间点云标签分布包含更多的语义信息.CL2M充分利用标签的分布规律计算分布间的距离,可准确划分正负样本,减少了常规硬划分带来的累计错误.在 2个公开数据集上进行的实验结果表明,CL2M在多个评价指标上优于既有的点云分割模型,验证了模型的有效性.

    计算机视觉点云分割对比学习自注意力机制边界挖掘

    基于背景-前景组成式建模的电路板异常检测

    傅冰飞陈同林许枫朱麟...
    144-159页
    查看更多>>摘要:异常检测的目标是检测众多正常样本中的异常样本.在大数据时代,如何将异常检测应用于现实场景成为当下需要着重思考的问题之一.目前已有模型存在难以处理实际场景中遮挡、光照、色差等动态干扰,无法快速迁移应用场景等问题.基于此,提出了一种基于背景-前景组成式建模的深度学习模型,用于检测电路板场景中的异常物体.首先通过特征提取网络将输入图像重构为不包含异常物体的干净背景图像,并通过跳层连接保留图像可能存在的动态干扰.得到重构背景后,通过空间变换网络提取到异常物体的位置信息,利用自编码器提取到异常物体外观、形状和存在的隐空间表示并重构出每个异常物体.将重构的异常物体和背景图像组合得到完整图像并通过对异常物体的存在表示给定阈值来实现异常检测.为了验证方法的有效性,从真实的电路板组装环境中收集数据,并模拟实际生产中标注有限的情景,从而创建用于分析的电路板异物数据集.此外,还在航道异物碎片数据集上进行实验验证.结果表明,提出的方法在该数据集上表现良好,能够检测出 9个真实场景数据中的所有异常目标,漏检率低至 0%,可以应用于现实世界的电路板组装场景.

    异常检测合成数据集组成式建模生成式模型多阶段训练