首页期刊导航|中国科学F辑
期刊信息/Journal information
中国科学F辑
中国科学杂志社
中国科学F辑

中国科学杂志社

月刊

1674-5973

informatics@scichina.org

100717

北京东黄城根北街16号

中国科学F辑/Journal Science in China(Information Sciences)CSCD北大核心CSTPCD
查看更多>>本刊是中国科学院和国家自然科学基金委员会共同主办、《中国科学》杂志社出版的学术刊物,本刊力求及时报道计算机科学与技术、控制科学与控制工程、通信与信息系统、电子科学与技术、生物信息学等领域基础及应用研究方面的原创性成果;月刊,中文版每月20日出版,英文版每月1日出版。
正式出版
收录年代

    我国巨型星座操作系统发展研究

    于登云李宗凌宋桂萍汪路元...
    449-460页
    查看更多>>摘要:巨型星座是未来天基系统的一个重要发展方向。本文基于巨型星座核心共性需求以及对桌面、物联网、车联网、卫星等典型应用场景操作系统发展历程的研判,分析了应用场景需求与操作系统间的演化规律,提出了我国发展完全自主可控星云操作系统的构想和技术途径,包括架构定义、硬件载体、内核设计、安全可信,以及生态建设等方面,以满足巨型星座复杂应用场景的需求。

    巨型星座星云操作系统共性需求应用场景发展思路

    面向泛在操作系统的结构化存储

    范晓鹏阎松翁楚良
    461-490页
    查看更多>>摘要:人机物融合泛在计算的新场景和新模式,需要新型的操作系统,即泛在操作系统。存储管理作为泛在操作系统的一项核心功能,设计轻量化、高性能和动态可适配的存储系统是推进泛在操作系统发展的必要举措。然而,对于"端(终端设备)-边(边缘端)-云(云端)"泛在场景中普遍存在的结构化数据,传统存储解决方案存在I/O放大严重、系统体量过大和软件栈冗余等问题,难以满足泛在应用的需求。为此,本文从系统全栈的角度进行原创性探索,提出原生表存储系统。本文首先回顾了计算机系统的发展历史;之后分析泛在计算时代的新需求,总结出泛在操作系统的基本形态,并介绍最新研究成果;然后剖析了现有结构化存储方案在"端-边-云"场景下面临的挑战;进一步提出面向泛在操作系统的原生表存储系统,并从端侧和边/云侧两个场景深入分析其架构优势。最后,总结全文并展望未来发展趋势。

    泛在计算泛在操作系统原生表存储软件栈端-边-云

    BrickOS:面向异构硬件资源的积木式内核

    古金宇李浩夏虞斌管海兵...
    491-513页
    查看更多>>摘要:人机物融合的新兴领域需要新型操作系统内核以支持泛在计算,对下管控海量异构硬件,对上服务动态多变应用场景。本文提出一种积木式内核架构BrickOS,可以根据使用场景灵活选择要加入内核的系统组件,同时可以选择将系统组件运行在用户态以提供较好的安全性,或者运行在共享地址空间的内核态中以提升性能。为了保障运行在相同地址空间中的系统组件的安全性,BrickOS为底层硬件的内存保护机制提供了统一的抽象,并将其用于单地址空间的内存隔离。测试结果表明BrickOS可以根据不同场景生成定制化内核,并拥有较低的进程间通信(inter-process call,IPC)开销,整体性能良好。

    操作系统内核组件编排进程间通信内存隔离

    面向外包服务的可验证技术研究进展

    孙奕杨帆陈性元杜学绘...
    514-565页
    查看更多>>摘要:随着数字经济时代的到来,数据已成为重要生产要素,将数据外包给第三方存储、管理、分析、计算等应用越来越广泛,随之而来的外包数据、外包计算等外包服务的可信性问题也日益突出,可验证技术被视为判定外包服务可信的一种有效且具有广泛应用前景的技术。该技术发展迅速、研究内容丰富、技术多样、种类繁多,且随着区块链、人工智能、隐私计算等新型外包服务需求的出现,为可验证技术带来了新的挑战和发展契机。本文对面向外包服务的可验证技术研究进展进行了梳理与总结。首先梳理总结给出了面向外包服务的可验证技术框架、分类方法、安全目标与评价体系。接着从外包数据和外包计算两个角度给出可验证技术的形式化定义,并分别论述其典型的可验证方案。然后从外包数据的角度,以验证数据类型为主线结合实现的功能和方法分别详细论述了不同数据类型、不同场景、不同实现方式的外包数据持有性验证和完整性验证技术;从外包计算的角度,根据外包计算类型的不同,总结归纳了 5种典型外包计算的可验证技术特点及研究进展,并基于提出的评价体系对典型方案进行了详细的对比分析。最后结合新兴技术和应用热点,展望了可验证技术在前沿方向上的发展趋势、应用前景及其面临的挑战。

    外包服务外包数据验证可验证计算可认证数据结构动态可验证结构

    联邦学习在高度数据异构场景下的泛化鲁棒性增强

    万伟胡胜山陆建荣李明慧...
    566-581页
    查看更多>>摘要:联邦学习(federated learning,FL)是一种以保护客户隐私数据为中心的分布式处理网络,为解决隐私泄露问题提供了前景良好的解决方案。然而,FL的一个主要困境是高度非独立同分布(non-independent and identically distributed,non-ⅡD)的数据会导致全局模型性能很差。尽管相关研究已经探讨了这个问题,但本文发现当面对non-ⅡD数据、不稳定的客户端参与以及深度模型时,现有方案和标准基线FedAvg相比,只有微弱的优势或甚至更差,因此严重阻碍了 FL的隐私保护应用价值。为解决这个问题,本文提出了 一种对non-ⅡD数据鲁棒的优化方案:FedUp。该方案在保留FL隐私保护特点的前提下,进一步提升了全局模型的泛化鲁棒性。FedUp的核心思路是最小化全局经验损失函数的上限来保证模型具有低的泛化误差。大量仿真实验表明,FedUp 显著优于现有方案,并对高度non-ⅡD数据以及不稳定和大规模客户端的参与具有鲁棒性。

    分布式网络联邦学习异构优化泛化性鲁棒性隐私保护

    一种基于动态可寻址会话的服务器无感知计算

    李子俊赵一龙陈全过敏意...
    582-602页
    查看更多>>摘要:服务器无感知计算作为云原生范式中快速发展的新兴技术,因其按需付费、自动资源伸缩和底层环境屏蔽等特点而受到越来越多的开发人员欢迎。FaaS(函数即服务)作为Serverless架构的主要实现方式,以函数粒度对应用进行解耦和执行。大多数云服务提供商也为应用开发人员提供了基于Serverless架构的应用搭建服务,这些服务允许开发人员以函数的形式部署代码,并根据实际的请求量进行自动扩缩容。然而,在部署有状态函数时,由于Serverless架构的无状态特性,管理其中的有状态数据变得复杂,往往无法满足Serverless中函数对有状态数据的访问性能要求。因此,本文提出了一种基于有状态和动态可寻址会话机制的服务器无感知计算系统XFaaS,实现了低开销的有状态数据访问和更高的应用吞吐。实验结果表明,通过采用XFaaS系统部署有状态函数的方式,可以降低有状态数据访问时延3个数量级,并提高2倍以上的函数最大吞吐量。

    服务器无感知计算函数即服务有状态函数粘滞会话容器

    基于混合比例估计的标签噪声学习方法

    郑庆华曹书植阮建飞赵锐...
    603-622页
    查看更多>>摘要:近年来,人工智能蓬勃发展,伴随着计算硬件算力的提升,深度学习已成为了人工智能算法的新范式。然而深度学习依赖大量精确标注的数据,在现实的多类别分类场景中,受限于标注成本和隐私数据保护等因素,大量精准标注的数据往往难以获得。近些年,移动众包和网络爬虫这类经济廉价的数据收集方法被广泛采用,但他们不可避免地引入了错误标注,即标签噪声。鉴于深度神经网络强大的数据拟合能力,标签噪声的存在将造成算法的过拟合,严重制约了深度学习方法的泛化能力。针对标签噪声问题,现有研究大多显式或隐式地依赖锚点(明确属于某一类别的样本),然而在现实场景中锚点难以获取,这使得现有解决方案不再适用。为解决这一问题,本文创造性地将多类别标签噪声学习问题转化为混合比例估计(mixture proportion estimation,MPE)问题,构建了一种不依赖锚点的满足统计一致性的学习算法。本文的主要贡献包括:(1)对现有的仅适用于二组成物MPE场景的R-MPE(regrouping-MPE)方法进行推广,提出了多组成物场景下不依赖不可约假设的MPE方法MR-MPE(multi-component oriented R-MPE);(2)理论上证明了多类别分类场景下标签噪声学习算法锚点假设和MPE问题不可约假设的等价性,并基于所提出的MR-MPE方法构建了不依赖锚点的满足统计一致性的算法。本文在合成噪声数据集和真实噪声数据集上分别与现有算法进行了对比实验,结果显示本文所提算法在多个数据集上均展现出了最优的性能;同时,在移除锚点的情况下,本文对算法的鲁棒性进行了测试,验证了所提算法不依赖锚点的特性。

    混合比例估计多类别分类标签噪声学习锚点不可约假设统计一致性

    稳健选择伪标注的混合式半监督学习

    郭兰哲李宇峰
    623-637页
    查看更多>>摘要:半监督学习旨在数据标注缺乏的情形下利用无标注数据提升学习性能,是重要的机器学习范式。尽管不少研究报道表明半监督学习取得了优异的性能表现,然而其在面临诸多实践任务时仍存在伪标注质量判断困难、超参数选择敏感、理论指导缺乏等瓶颈。针对上述挑战,本文提出一种稳健选择伪标注的混合式半监督学习方法,通过综合利用模型预测结果之间的分歧自适应地判断伪标注质量,无需预设超参数,显著提升了半监督学习的稳健性。本文在理论上证明了新方法的错误率随训练轮数的增加而显著下降。实验验证了本文方法较主流技术取得了明显的性能提升,例如,相较于在CIFAR-10数据集中表现最优的半监督学习技术FixMatch,新方法的分类错误率下降了 11%以上,在更具挑战的STL-10数据集中分类错误率下降了 18。8%。

    机器学习深度学习半监督学习伪标注稳健性

    深度ReLU神经网络的万有一致性

    刘霞王迪
    638-652页
    查看更多>>摘要:随着数据量爆炸式增长、计算资源愈加丰富,浅层神经网络并不总能满足时代需求,从而导致深度神经网络的出现。深度神经网络的迅猛发展主要体现在应用领域,其理论研究相对匮乏。基于此,本文聚焦研究深度ReLU神经网络的万有一致性,具体内容包括:首先,是否存在一个具有统一结构的深度神经网络(即深度、宽度、激活函数等均已确定)使得该深度神经网络可以学习更多特征,并具有万有逼近性;其次,针对已确定的深度神经网络模型,证明其是强万有一致的;最后,从实验的角度验证理论结果的合理性。

    深度神经网络万有一致性深度学习ReLU函数逼近性

    分心感知的伪装物体分割

    梅海洋杨鑫周运铎季葛鹏...
    653-673页
    查看更多>>摘要:本文致力于设计一个有效且高效的伪装物体分割(camouflaged object segmentation,COS)模型。为此,本文开发了 一个生物启发的框架,称为金字塔定位和聚焦网络(pyramid positioning and focus network,PFNet+),其模仿了自然界中的捕食过程。具体地,本文的PFNet+包含3个关键模块,即上下文增强模块(context enrichment,CEn)、金字塔定位模块(pyramid positioning module,PPM)和聚焦模块(focus module,FM)。CEn通过整合上下文信息来增强骨干特征的表征能力,从而提供更有辨别性的骨干特征。PPM模仿捕食中的检测过程,以金字塔的方式从全局的角度定位潜在的目标物体。然后FM执行捕食中的识别过程,通过在歧义区域的聚焦逐步细化初始的预测结果。值得注意的是,在FM中,本文开发了一个新颖的分心挖掘策略,用于分心区域的发现和去除,以提高预测的性能。大量的实验证明本文的PFNet+能够实时运行(56 fps),在4个标准度量指标下,PFNet+在3个具有挑战性的数据集上都显著优于现有的20个最新模型,在其他视觉任务(如息肉分割)上的实验进一步证明了 PFNet+的泛化能力。

    伪装物体分心上下文增强上下文探索金字塔分割