首页期刊导航|计算机学报
期刊信息/Journal information
计算机学报
计算机学报

高文

月刊

0254-4164

cjc@ict.ac.cn

010-62620695

100190

中国科学院计算技术研究所(北京2704信箱)

计算机学报/Journal Chinese Journal of ComputersCSCD北大核心CSTPCDEI
查看更多>>本刊是中国计算机领域的有代表性学术刊物,作为一种科学研究档案,代表了计算机领域各个研究阶段的水平。本刊被《工程索引》(美国)、《科学文摘》(英国)、《数学文摘》(美国)、《科技文献速报》(日本)、《文摘杂志》(俄罗斯)等多种权威系统收录。是科技部科技信息研究所科技论文统计源期刊、中国科学引文数据库来源期刊。
正式出版
收录年代

    神经网络后门攻击与防御综述

    汪旭童尹捷刘潮歌徐辰晨...
    1713-1743页
    查看更多>>摘要:当前,深度神经网络(Deep Neural Network,DNN)得到了迅速发展和广泛应用,由于其具有数据集庞大、模型架构复杂的特点,用户在训练模型的过程中通常需要依赖数据样本、预训练模型等第三方资源.然而,不可信的第三方资源为神经网络模型的安全带来了巨大的威胁,最典型的是神经网络后门攻击.攻击者通过修改数据集或模型的方式实现向模型中植入后门,该后门能够与样本中的触发器(一种特定的标记)和指定类别建立强连接关系,从而使得模型对带有触发器的样本预测为指定类别.为了更深入地了解神经网络后门攻击原理与防御方法,本文对神经网络后门攻击和防御进行了体系化的梳理和分析.首先,本文提出了神经网络后门攻击的四大要素,并建立了神经网络后门攻防模型,阐述了在训练神经网络的四个常规阶段里可能受到的后门攻击方式和防御方式;其次,从神经网络后门攻击和防御两个角度,分别基于攻防者能力,从攻防方式、关键技术、应用场景三个维度对现有研究进行归纳和比较,深度剖析了神经网络后门攻击产生的原因和危害、攻击的原理和手段以及防御的要点和方法;最后,进一步探讨了神经网络后门攻击所涉及的原理在未来研究上可能带来的积极作用.

    深度神经网络触发器后门攻击后门防御攻防模型

    基于完形填空的方面级情感四元组预测

    彭文忠夏家莉万齐智刘德喜...
    1744-1768页
    查看更多>>摘要:方面情感四元组预测(ASQP)任务旨在从给定的评论语句中提取所有方面词以及相应的方面类别、观点表达和情感极性,有助于全面了解用户对产品或服务不同方面的评价情况.现有情感四元组预测方法主要存在以下局限:(1)判别式模型没有利用prompt捕获情感元素之间的语义关系;(2)生成式模型要么简单地将情感元素类型标签组合形成prompt,缺乏理解标签类型涵义的语境;要么将离散模板作为解码器的输入,而编码器则无法捕获到模板中情感元素之间的语义关系.为了缓解这些问题,本文首先基于完形填空思想研制离散和连续2类prompt,提供理解4个情感元素类型涵义的语境,帮助模型更好地捕获情感元素之间的语义关系;然后,基于设计的prompt,提出C-ASQP框架,包含判别式模型DC-ASQP和生成式模型GC-ASQP.在DC-ASQP中,采用2阶段策略,先预测4个情感元素中2个较为容易的情感元素,再将预测结果嵌入到设计的prompt中,帮助模型理解情感元素类型的涵义,从而有效预测另外2个情感元素.在GC-ASQP中,将设计的prompt作为编码器的输入,借助预训练模型的学习模式,充分利用预训练模型蕴含的知识提升四元组的生成效果.实验结果显示,DC-ASQP模型在4个常用数据集上的F1值相比同类判别式最优模型分别提高4.70%、6.48%、6.97%和2.60%,GC-ASQP模型的F1值比最优基准模型分别提高0.86%、1.67%、0.15%和1.02%,验证了将ASQP建模为完形填空任务的有效性,所设计的2类prompt以及C-ASQP框架是有效的.

    方面情感四元组预测完形填空离散和连续prompt判别式和生成式模型C-ASQP框架

    基于时空信息辅助监督的语言-视频对比学习模型

    张冰冰张建新李培华
    1769-1785页
    查看更多>>摘要:同时使用语言和图像两种模态信息的神经网络模型在计算机视觉领域取得了很大进展.一些将其用于视频识别任务的工作,存在未考虑视频中丰富的时间-空间信息、用于描述类别的文本过于简单等不足.对此,本文提出了基于时空辅助信息监督的语言-视频对比学习模型.对于视频编码,提出了基于类别词元的时序加权位移模块进行时序建模,使得时序信息在网络从底层到高层的各个层次传播;而且还提出了时空信息辅助监督模块,深入挖掘视觉词元中蕴含的丰富时空信息.对于语言编码,提出了一种基于大语言模型的提示学习方法,对行为类别文本描述进行扩展,生成具有丰富上下文语义信息的文本描述.实验部分,本文提出的模型在4个视频行为识别数据集mini-Kinetics-200、Kinetics-400、UCF101和HMDB51上,达到了优于当前最先进方法或与当前最先进方法识别准确率相当的水平,比基线方法的识别准确率分别提升了 2.5%、0.3%、0.6%和2.4%.

    行为识别多模态模型时序建模时空信息辅助监督提示学习

    基于双曲正切和矩的免疫防御

    吴昊王金伟罗向阳马宾...
    1786-1812页
    查看更多>>摘要:对抗样本的发现与研究证实了深度神经网络的脆弱性.如果不对对抗样本的生成加以约束,那么触手可及的图像将不再安全并随时可能对不鲁棒的深度神经网络构成威胁.然而,现有的对抗防御主要旨在防止对抗样本成功攻击深度神经网络,而不是防止对抗样本的生成.因此,本文提出了一种新颖的对抗防御机制,该机制被称为免疫防御.免疫防御通过主动地在原始图像上添加难以察觉的扰动使得攻击者无法针对该图像制作出有效的对抗样本,从而同时保护了图像和深度神经网络.这种良性的扰动被称为免疫扰动,添加了免疫扰动的图像被称为免疫样本.在白盒免疫防御中,本文提出了双曲正切免疫防御(Hyperbolic Tangent Immune Defense,HTID)以制作高分类准确率、高防御性能和高视觉质量的白盒免疫样本;在黑盒免疫防御中,提出了基于矩的免疫防御(Moment-based Immune Defense,MID)以提升免疫样本的可迁移性,从而确保免疫样本对未知对抗攻击的防御性能.此外,本文还提出了免疫率以更加准确地衡量免疫样本的防御性能.在CIFAR-10、MNIST、STL-10和Caltech-256数据集上的大量实验表明,HTID和MID制作的免疫样本具有高分类准确率,在Inception-v3、ResNet-50、LeNet-5和Model C上的准确率均达到了 100.0%,比原始准确率平均高出10.5%.制作的免疫样本同时具有高视觉质量,其SSIM最低为0.822,最高为0.900.实验也表明MID有着比HTID更高的可迁移性,MID在四个数据集上针对AdvGAN制作的免疫样本防御其他11种对抗攻击的平均免疫率分别为62.1%、52.1%、56.8%和 48.7%,这比 HTID 高出 15.0%、10.8%、17.5%和 15.7%.

    深度神经网络对抗样本对抗防御免疫防御可迁移性

    基于环上容错学习的异步分布式随机信标及其在异步共识中的应用

    张宗洋李天宇胡斌周游...
    1813-1831页
    查看更多>>摘要:安全高效的异步分布式随机信标是异步共识协议能够快速终止的必要保障.2008年以来,比特币中区块链技术的成功促进了分布式应用的蓬勃发展,为分布式应用提供随机性来源的分布式随机信标也受到了学者的广泛研究.现有的分布式随机信标一般选取公开可验证秘密共享、可验证随机函数、可验证延迟函数之一作为基础结构进行设计,其中公开可验证秘密共享结构简单、模块清晰、实用性较强,是现有分布式随机信标协议中数量最多、分析最为透彻的类别,其它结构的协议研究开始时间较晚,设计方法并未固定,在形式化安全定义和安全分析中尚有较大空白等待填补.目前,只有少数基于公开可验证秘密共享的方案支持异步网络模型,并且这些方案都是利用不抗量子的离散对数问题构建的.因此,在后量子安全的异步网络模型下,现有异步共识成果不得不采用期望运行轮数为指数的本地抛币协议来保障全栈量子安全.本文主要研究抗量子安全假设下基于公开可验证秘密共享的方案,具体贡献如下:(1)本文首先基于抗量子困难假设环上容错学习和公开可验证秘密共享的结构范式,设计了具备O(Nlog N)证明及验证复杂度的公钥更新协议,其中N为多项式次数,该协议保证了节点在每一轮产生随机数份额的过程中采用了一致且正确的新公钥.(2)在此基础上,本文设计了计算复杂度为O(n),通信复杂度为O(n2)的异步分布式随机信标协议,其中n为节点规模.在相同的安全参数下,本文提出的随机信标协议相较于基于离散对数的协议运行时延减小约34%.(3)最后,本文给出了一种基于异步分布式随机信标的异步共识协议,并证明其满足标准的安全需求.

    分布式随机信标异步网络量子安全门限密码零知识证明

    高效的隐私保护多方多数据排序

    商帅李雄张文琪汪小芬...
    1832-1852页
    查看更多>>摘要:安全多方计算允许具有私密输入的多个参与方联合计算一个多输入函数而不泄露各参与方私有输入的任何信息,因此近年来受到广泛关注.作为安全多方计算中的一个基础问题,隐私保护排序允许多个参与方在不泄露数据集隐私的前提下计算多个数据集的排序结果,广泛应用于产品定价、拍卖等场景.现有的隐私保护排序协议大多只支持两个参与方.而已有的多方多数据排序协议通信开销大、计算复杂度高,整体效率较低.现有隐私保护排序协议均未考虑恶意参与者的穷举攻击,因此安全保护不足.对此,本文提出一个高效的隐私保护多方多数据排序协议.多个参与方仅需O(1)轮交互即可以隐私保护的方式获得其持有的多个数据的排序结果.具体来讲,本文设计一种基于多项式的编码方法,将参与方的数据集编码为一个多项式,其每项的指数和系数分别代表数据和该数据的个数.通过多项式加法可实现多个参与方数据集的排序.同时,本文设计了多项式加密、聚合多项式生成和解密多项式生成算法,在保证计算正确性的同时实现多项式的隐私保护.最后,各参与方通过不经意传输技术获得排序结果.本文定义了不合谋参与方穷举攻击下的恶意安全.安全性分析表明本文协议不仅实现了半诚实安全性,而且达到了不合谋恶意用户穷举攻击的恶意安全性.此外,大量实验表明本文提出的协议在通信和计算方面都十分高效.如当参与方数量为15、每个参与方持有20 000个数据、数据上界为500 000时,本文协议的通信和计算开销分别为898.44 MB和69.76 s,仅为LDYW协议的12.08%和76.85%;而相对于AHM+方案,本文协议在通信开销仅增加约4倍的情况下使计算效率提升了约20倍.

    隐私计算安全多方排序安全数据分析隐私保护排序

    面向强化学习的可解释性研究综述

    曹宏业刘潇董绍康杨尚东...
    1853-1882页
    查看更多>>摘要:强化学习作为机器学习的一种范式,因其强大的策略试错学习能力,受到关注.随着深度学习的融入,强化学习方法在许多复杂的控制任务中取得了巨大成功.然而,深度强化学习网络作为黑盒模型,其缺乏可解释性所带来的不安全、不可控及难理解等问题限制了强化学习在诸如自动驾驶、智慧医疗等关键领域中的发展.为了解决这一问题,科研人员开展了对强化学习可解释性的研究.然而,这些研究开展相对较晚,且缺少针对多智能体强化学习可解释性方法的系统性总结,同时,可解释性的定义存在人为主观性,导致系统性面向强化学习过程的可解释性研究较为困难.本文对当前强化学习的可解释性研究工作进行了全面的整理与总结.首先,对强化学习的可解释性进行定义并总结了相关评估方法.随后,基于马尔可夫决策过程,划分了行为级解释、特征级解释、奖励级解释及策略级解释四个类别.此外,在每个类别中,分析了单智能体及多智能体的策略解释方法,并特别关注可解释性研究中的人为因素,描述了人机交互式的解释方法.最后,对当前强化学习可解释性研究面临的挑战以及未来的研究方向进行总结与展望.

    强化学习可解释性机器学习人工智能马尔可夫决策过程

    gEdge:基于容器技术的云边协同的异构计算框架

    汪沄汤冬劼郭开诚戚正伟...
    1883-1900页
    查看更多>>摘要:由于按需灵活配置、高可用性、高资源利用率等优点,云计算技术成为过去十年的主流计算范式.随着万物互联时代的到来,单独依赖云计算技术已经无法满足数以亿计的IoT设备及其数据流量的需求.边缘计算可以被看作是云计算的进化,它因5G网络和物联网的崛起而诞生.随着云游戏、VR技术以及人工智能技术在日常生活中的广泛运用,对计算资源的需求也在日渐增长.然而,受体积与功耗限制,处于边缘的节点设备算力较弱.本文提出了 gEdge:一种基于容器技术的云边协同的异构计算框架.该框架通过GPU虚拟化技术,将云端的物理GPU资源分为多块虚拟GPU资源,按需为边缘节点提供GPU算力资源,并且对用户容器无感知.实验表明,使用gEdge框架使边缘节点使用的容器镜像体积降低了 48.8%,容器启动时间降低了 35.5%,平均相对运行速度提高了 213%.

    图形处理器虚拟化技术容器技术边缘计算云边协同

    数据库参数配置智能调优研究综述

    李奕言田季坤蒲照李翠平...
    1901-1921页
    查看更多>>摘要:数据库系统具有大量的参数,这些参数控制了系统的内存分配、I/O优化、备份与恢复等诸多方面,极大地影响着数据库的性能.随着数据库和应用程序的规模和复杂性的增长,传统依靠数据库管理员手动配置参数的方式已经越来越难以满足用户需求.数据库参数配置智能调优将机器学习技术应用到参数调优领域,依据负载信息、数据库参数和性能,借助机器学习算法推荐一组最优的参数.本文针对现有参数配置智能调优技术,从调优方法、应用情况和未来挑战三个方面依次进行梳理和总结.首先将现有参数调优方法依据所用算法不同分为五类,从原理、技术、优缺点等方面对各类方法进行详细介绍和总结.之后介绍当前工业界主流的参数调优工具,分析参数配置智能调优在实际应用过程中遇到的问题及原因.最后,本文对数据库参数配置智能调优的未来研究方向进行了展望.本文旨在帮助研究者掌握当前数据库参数配置智能调优领域主流方法及面临的问题,以推动后续研究工作的开展.

    机器学习参数调优贝叶斯优化强化学习智能数据库

    基于概率逻辑推理的高阶互补云API推荐方法

    陈真谢登辉王小龙孙梦梦...
    1922-1948页
    查看更多>>摘要:云时代,云API作为服务交付、数据交换和能力复制的最佳载体,已成长为当今面向服务软件开发和企业数字化转型不可或缺的核心要素.然而动态开放网络中持续增长的云API在给开发者提供了更多选择的同时,也将其淹没在海量的云API选择之中,设计有效的云API推荐方法就此成为API经济健康发展中迫切要解决的现实问题.但是,现有研究主要利用搜索关键词、服务质量和调用偏好进行建模,生成质量高功能单一的云API推荐列表,没有考虑服务化软件实际开发中开发者对多元化高阶互补云API的客观需要.高阶互补云API推荐旨在为多个查询云API生成多元互补云API列表,要求推荐结果与查询云API均互补,以满足开发者的联合需求.针对此问题,本文提出基于概率逻辑推理的高阶互补云 API 推荐方法(Probabilistic Logic Reasoning for High-order Complementary Cloud API Recom-mendation,PLR4HCCR).首先,通过云API生态真实数据分析论证云API互补推荐需求的必要性和互补关系建模中替补噪声的客观存在,为云API互补推荐问题研究提供动机和数据支持.其次,采用Beta概率嵌入对云API及其之间的关系约束进行编码,以刻画云API间互补关系的不确定性和支持互补逻辑推理.接着,设计由投影、取反和交并三个基本逻辑算子构建的互补关系逻辑推理网络,使查询集中的每个云API获得非对称互补关系感知和替补噪声消解约束下的互补云API表示.然后,引入注意力机制为查询云API的互补云API分配不同权重,增强高阶互补云API基向量的表征能力.在此基础上,采用KL散度度量高阶互补云API基向量与候选云API之间的距离,并根据KL散度排序生成高阶互补性可感知下的云API推荐结果.最后,我们利用两个真实云API数据集在不同阶互补推荐场景下进行实验,实验表明,与传统启发式推荐方法和深度学习推荐方法相比,PLR4HCCR在互补关系感知推理和替补噪声消解方面均具有较大的优势,继而使其在低阶、高阶和混合阶互补云API推荐中均展示出更优的推荐效果和更强的泛化能力.进一步,超参数敏感性实验、实例分析和用户调查验证了方法的有效性、实用性和可行性,这使结合高阶互补关系的云API推荐方法PLR4HCCR不仅更有可能生成开发者满意的结果,而且可有效提升云API服务提供者的收益.

    面向服务软件开发云API推荐高阶互补逻辑推理Beta概率嵌入