首页期刊导航|计算机研究与发展
期刊信息/Journal information
计算机研究与发展
计算机研究与发展

徐志伟

月刊

1000-1239

crad@ict.ac.cn

010-62620696;62600350

100190

北京中关村科学院南路6号

计算机研究与发展/Journal Journal of Computer Research and DevelopmentCSCD北大核心CSTPCDEI
查看更多>>本刊是中国科学院计算技术研究所和中国计算机学会联合主办、科学出版社出版的学术性刊物、中国计算机学会会刊,我国第一个计算机刊物。主要刊登计算机科学技术领域高水平的学术论文、最新科研成果和重大应用成果。
正式出版
收录年代

    FPCBC:基于众包聚合的联邦学习隐私保护分类系统

    金歌魏晓超魏森茂王皓...
    2377-2394页
    查看更多>>摘要:随着企业、政府以及私人等数据资产的不断增加,机器学习领域对于图像等分类应用需求也随之不断增涨.为了应对各种实际的需求,机器学习即服务(machine learning as a service,MLAAS)的云服务部署思想逐渐成为主流.然而,基于云服务实现的应用往往会带来严重的数据隐私安全问题.FPCBC(federated learning privacy-preserving classification system based on crowdsourcing aggregation)是 一种基于众包聚合的联邦学习隐私保护分类系统.它将分类任务众包给多个边缘参与方并借助云计算来完成,不再使用联合训练理想模型的方式来得到可信度高的分类结果,而是让参与方先根据本地有限数据训练出的模型进行推理,然后再使用成熟的算法对推理结果聚合得到较高准确率的分类.重要的是,保证了数据查询方不会泄露任何隐私数据,很好地解决了传统MLAAS的隐私安全问题.在系统实现中,使用同态加密来对需要进行机器学习推理的图像数据加密;改善了一种众包的联邦学习分类算法,并通过引入双服务器机制来实现整个系统的隐私保护计算.通过实验和性能分析表明了该系统的可行性,且隐私保护的安全程度得到了显著提升,更适用于实际生活中对隐私安全需求较高的应用场景.

    联邦学习众包同态加密隐私保护机器学习分类

    基于秘密共享和压缩感知的通信高效联邦学习

    陈律君肖迪余柱阳黄会...
    2395-2407页
    查看更多>>摘要:深度学习技术的快速发展给我们带来了极大的便利,但同时也导致大量隐私数据的泄露.联邦学习允许客户端在只共享梯度的情况下联合训练模型,这看似解决了隐私信息泄露问题,但研究表明联邦学习框架中传输的梯度依然会导致隐私信息泄露.并且,联邦学习的高通信代价的特点难以适用于资源受限的环境.为此,提出了 2个通信高效且安全的联邦学习算法,算法使用Top-K稀疏及压缩感知等技术以减少梯度传输造成的通信开销,另外利用安全多方计算中的加法秘密共享对重要的梯度测量值加密,以实现在减少通信开销的同时进一步增强其安全性.2个算法的主要区别是客户端与服务器通信时传递的分别为梯度测量值与梯度测量值的量化结果.在MNIST及Fashion-MNIST数据集上的实验表明,与其他算法相比,本文所提的算法在保证通信代价较低的情况下进一步增加了安全性,同时在模型准确性上也有较好的性能.

    压缩感知安全多方计算联邦学习高效通信资源受限

    一种面向云边端系统的分层异构联邦学习方法

    钟正仪包卫东王吉吴冠霖...
    2408-2422页
    查看更多>>摘要:联邦学习(federated learning)通过用上传模型参数的方式取代了数据传输,降低了隐私泄露的风险.然而,将联邦学习应用到云边端框架下时,一方面,由于云边端存在边缘和终端两层分布式框架,对传统的单层联邦学习提出挑战;另一方面,终端节点因资源异构难以训练相同复杂度的模型,无法满足联邦学习客户端统一模型的假设.针对上述第1个问题,从传统的单层联邦学习方法出发,设计了面向云边端分层部署模型的联邦学习方案;针对第2个问题,通过在终端模型插入分支的方式,将大模型拆分为不同复杂度的小模型适配不同客户端资源状态,从而实现异构联邦学习.同时,考虑到终端存在大量无标签数据无法进行有效模型训练的问题,还提出了针对联邦框架的半监督学习方法,实现对无标签数据的有效利用.最终,通过MNIST和FashionMNIST数据集对方法进行了验证.实验结果表明,在有效避免隐私泄露的前提下,相比于其他同构和异构学习方法,所提方法最大可提升22%的模型准确率;在计算、通信、存储等资源开销上均有明显降低.

    联邦学习隐私安全资源异构云边端半监督学习

    基于区块链的隐私保护去中心化联邦学习模型

    周炜王超徐剑胡克勇...
    2423-2436页
    查看更多>>摘要:传统的联邦学习依赖一个中央服务器,模型训练过程易受单点故障和节点恶意攻击的影响,明文传递的中间参数也可能被用来推断出数据中的隐私信息.提出了一种基于区块链的去中心化、安全、公平的联邦学习模型,利用同态加密技术保护协同训练方的中间参数隐私,通过选举的联邦学习委员会进行模型聚合和协同解密.解密过程通过秘密共享方案实现安全的密钥管理,利用双线性映射累加器为秘密份额提供正确性验证.引入信誉值作为评估参与方可靠性的指标,利用主观逻辑模型实现不信任增强的信誉计算作为联邦学习委员会的选举依据,信誉值作为激励机制的参考还可以保障参与公平性.模型信息和信誉值通过区块链实现数据的防篡改和不可抵赖.实验表明,模型在训练准确率相比中心化学习模型略有损失的情况下,能够保障在多方协作的环境下以去中心化的方式训练模型,有效实现了各参与方的隐私保护.

    区块链联邦学习隐私保护同态加密双线性映射累加器信誉

    面向安全持久性内存的元数据协同管理方法

    魏学亮杨明顺冯丹刘景宁...
    2437-2450页
    查看更多>>摘要:新型非易失存储器是下一代计算机内存最具潜力的候选之一.基于非易失存储器构建持久性内存系统面临着2方面挑战:保证数据安全性、优化写操作.为此,现有工作提出加密和完整性检测技术以保证安全性,同时提出选择重加密策略以优化写操作.这些技术在持久性内存中引入多种元数据,但尚无研究工作综合考虑各类元数据特性以实现高效管理.为解决此问题,提出一种面向安全持久性内存的元数据协同管理方法(coordinated metadata management for secure persistent memory,COTANA).COTANA将加密和选择重加密元数据整合在相同块中,以减少加解密时元数据访问开销.同时,COTANA将整合后的块作为叶子结点构建完整性检测树,并通过将消息鉴别码放置在纠错码芯片中避免额外访问延迟.此外,通过实验发现数据块中不同字节存在不同修改频率.在选择重加密时,COTANA采用动态数据分片策略,从现有的连续分片方法和针对修改频率规律设计的聚集分片方法中动态选择造成位翻转最少的方法.实验结果显示,与采用最新的元数据管理方法和选择重加密策略的系统相比,COTANA最多能提升13.7%的性能,并减少21.3%的位翻转.

    非易失存储器持久性内存安全加密完整性检测选择重加密元数据管理

    一种适用于分布式存储集群的纠删码数据更新方法

    章紫琳刘铎谭玉娟吴宇...
    2451-2466页
    查看更多>>摘要:目前分布式存储集群广泛采用纠删码来保证数据可靠性,但是数据更新密集时存储集群的磁盘I/O开销会成为性能瓶颈.在常用的纠删码数据更新方法中,磁盘I/O开销主要包括:1)更新数据块时对数据节点的读后写操作;2)更新校验块时读写 日志的磁盘寻道开销.针对这些问题,提出PARD(parity logging with reserved space and data delta)数据更新方法,其主要思想是首先利用纠删码线性运算的特性来减少读后写操作;然后根据磁盘特性来降低磁盘寻道开销.PARD包含3个设计要点:1)采用即时的数据块更新和基于日志的校验块更新;2)利用纠删码线性运算的特性,构建基于数据增量的日志,极大限度地消除对数据节点的读后写操作;3)根据磁盘特性,在数据文件末尾为日志预留空间,减少读写日志的磁盘寻道开销.实验结果表明,当块大小为4 MB时,PARD的更新吞吐率相较于PLR(parity logging with reserved space),PARIX(speculative partial write),FO(full overwrite),分别 至少提升了30.4%,47.0%,82.0%.

    纠删码存储集群数据更新增量预留空间

    文本情感原因自动提取综述

    邱祥庆刘德喜万常选李静...
    2467-2496页
    查看更多>>摘要:情感原因提取是情感计算领域研究的一个新方向,是一种细粒度的情感分析,其目的是要找出给定文档中触发情感的那部分文本,是对情感的一种追根溯源.情感原因提取涉及到语言学、心理学等相关的领域知识,具有较高的学术研究价值和广泛的应用场景.尽管情感计算的相关研究大多集中在情感识别、情感预测、情感信息抽取等方面,但近些年不少学者已开始深入到情感背后的原因分析与提取上,并产生了较为丰富的成果.从问题定义、任务类别、研究方法、主流数据集、评测指标等多个角度对基于文本的情感原因自动提取的研究成果进行全面回顾和分析,重点对情感原因提取的方法特别是基于深度学习的方法进行了梳理,最后总结了现有情感原因提取工作的不足及其未来所面临的挑战.

    情感分析情感原因提取情感原因对机器学习深度学习

    基于组件特征与多注意力融合的车辆重识别方法

    胡煜陈小波梁军陈玲...
    2497-2506页
    查看更多>>摘要:为提升车辆重识别算法的性能,提出一种基于车辆组件特征与多注意力融合的特征学习方法.首先,修改深度残差网络以获取具有丰富语义信息的特征图,同时应用语义分割网络将车辆图像划分为车辆正面、背面、顶面、侧面及背景区域,以实现组件特征提取并消除视角变化的影响.然后,设计多注意力融合模块,基于面积注意力与特征注意力实现组件特征的自适应融合.最后,在多任务学习框架下,优化车辆重识别的三元组损失与辅助分类任务的交叉熵与焦点损失,对网络参数进行训练.在多个数据集上的实验结果表明,提出的方法在大多数性能指标上均超越了现有方法.进一步的消融实验证明了多注意力融合模块与多任务损失函数在特征提取上的有效性.

    车辆重识别组件特征抽取特征对齐组件注意力模块注意力融合

    三方众包市场中的发包方-平台博弈机制设计

    何雨橙丁尧相周志华
    2507-2519页
    查看更多>>摘要:众包(crowdsourcing)通常涉及到目标各不相同的多个参与者.设计有效的众包机制,使得各个参与者在竞争中实现共赢,是众包理论研究中的基本问题之一.当前,众包机制设计通常基于发包方-标注者直接进行交互的两方博弈模型.而现实应用中,发包方与标注者之间往往通过平台进行交互,从而构成三方博弈下的众包市场.其中的发包方-平台博弈机制设计是过往众包研究中未曾涉及的全新问题.将三方众包市场建模为不完全信息博弈,并证明该博弈问题的Nash均衡可通过在线学习来最小化发包方和平台的累计遗憾而达到.在单发包方情形下,证明经典的EXP3算法对于发包方的最优性,并基于反事实遗憾最小化技术为平台设计了有效策略.同时,将单发包方情形下发包方和平台策略拓展到多发包方情形下并给出理论分析.合成及真实数据集上的实验验证了该方法的有效性.

    众包博弈理论机制设计在线学习反事实遗憾最小化

    一种结合用户适合度和课程搭配度的在线课程推荐方法

    胡园园姜文君任德盛张吉...
    2520-2533页
    查看更多>>摘要:在线学习由于不受时空限制而愈来愈流行.如何从成千上万的在线课程中选择合适课程是在线学习者面临的极大挑战,在线课程推荐应运而生.但现有课程推荐系统仍面临2个主要问题:1)不同用户具有不同的学习能力和需求.因此,需要仔细考虑用户对不同课程的适合度,否则可能会导致推荐的课程难度太大.2)目前的课程推荐方法忽略了推荐课程与用户已学课程之间存在的可搭配关系,可能导致不合适的推荐.针对以上2个问题,首先深入分析了用户的学习特征、类型及其对不同课程的学习适合度;同时,利用课程的共同被选频率,对不同课程之间的可搭配关系进行探究.基于以上2个方面,提出了一种结合用户适合度和课程搭配度的课程推荐模型(user-suitability and course-matching aware course recommendation model,SMCR).在 CN(canvas network)数据集和 MOOC(massive open online courses)数据集上进行的对比实验结果表明,该方法可以达到更高的推荐准确性,而且SMCR模型能够向用户推荐既适合其学习又与其已学课程可以进行搭配的课程.

    在线课程个性化学习适合度课程搭配课程推荐