首页期刊导航|计算机学报
期刊信息/Journal information
计算机学报
计算机学报

高文

月刊

0254-4164

cjc@ict.ac.cn

010-62620695

100190

中国科学院计算技术研究所(北京2704信箱)

计算机学报/Journal Chinese Journal of ComputersCSCD北大核心CSTPCDEI
查看更多>>本刊是中国计算机领域的有代表性学术刊物,作为一种科学研究档案,代表了计算机领域各个研究阶段的水平。本刊被《工程索引》(美国)、《科学文摘》(英国)、《数学文摘》(美国)、《科技文献速报》(日本)、《文摘杂志》(俄罗斯)等多种权威系统收录。是科技部科技信息研究所科技论文统计源期刊、中国科学引文数据库来源期刊。
正式出版
收录年代

    基于不确定性估计的离线确定型Actor-Critic

    冯涣婷程玉虎王雪松
    717-732页
    查看更多>>摘要:Actor-Critic是一种强化学习方法,通过与环境在线试错交互收集样本来学习策略,是求解序贯感知决策问题的有效手段.但是,这种在线交互的主动学习范式在一些复杂真实环境中收集样本时会带来成本和安全问题.离线强化学习作为一种基于数据驱动的强化学习范式,强调从静态样本数据集中学习策略,与环境无探索交互,为机器人、自动驾驶、健康护理等真实世界部署应用提供了可行的解决方案,是近年来的研究热点.目前,离线强化学习方法存在学习策略和行为策略之间的分布偏移挑战.针对这个挑战,通常采用策略约束或值函数正则化来限制访问数据集分布之外(Out-Of-Distribution,OOD)的动作,从而导致学习性能过于保守,阻碍了值函数网络的泛化和学习策略的性能提升.为此,本文利用不确定性估计和OOD采样来平衡值函数学习的泛化性和保守性,提出一种基于不确定性估计的离线确定型 Actor-Critic 方法(Offline Deterministic Actor-Critic based on Uncertainty Esti-mation,ODACUE).首先,针对确定型策略,给出一种Q值函数的不确定性估计算子定义,理论证明了该算子学到的Q值函数是最优Q值函数的一种悲观估计.然后,将不确定性估计算子应用于确定型Actor-Critic框架中,通过对不确定性估计算子进行凸组合构造Critic学习的目标函数.最后,D4RL基准数据集任务上的实验结果表明:相较于对比算法,ODACUE在11个不同质量等级数据集任务中的总体性能提升最低达9.56%,最高达64.92%.此外,参数分析和消融实验进一步验证了 ODACUE的稳定性和泛化能力.

    离线强化学习不确定性估计分布外采样凸组合Actor-Critic

    自然语言处理中的探针可解释方法综述

    鞠天杰刘功申张倬胜张茹...
    733-758页
    查看更多>>摘要:随着大规模预训练模型的广泛应用,自然语言处理的多个领域(如文本分类和机器翻译)取得了长足的发展.然而,受限于预训练模型的"黑盒"特性,其内部的决策模式以及编码的知识信息被认为是不透明的.以OpenAI发布的ChatGPT和GPT-4为代表的先进预训练模型为例,它们在多个领域取得重大性能突破的同时,由于无法获知其内部是否真正编码了人们期望的知识或语言属性,以及是否潜藏一些不期望的歧视或偏见,因此仍然无法将其应用于重视安全性和公平性的领域.近年来,一种新颖的可解释性方法"探针任务"有望提升人们对预训练模型各层编码的语言属性的理解.探针任务通过在模型的某一区域训练辅助语言任务,来检验该区域是否编码了感兴趣的语言属性.例如,现有研究通过冻结模型参数并在不同层训练探针任务,已经证明预训练模型在低层编码了更多词性属性而在高层编码了更多语义属性,但由于预训练数据的毒性,很有可能在参数中编码了大量有害内容.该文首先介绍了探针任务的基本框架,包括任务的定义和基本流程;然后对自然语言处理中现有的探针任务方法进行了系统性的归纳与总结,包括最常用的诊断分类器以及由此衍生出的其他探针方法,为读者提供设计合理探针任务的思路;接着从对比和控制的角度介绍如何解释探针任务的实验结果,以说明探测位置编码感兴趣属性的程度;最后对探针任务的主要应用和未来的关键研究方向进行展望,并讨论了当前探针任务亟待解决的问题与挑战.

    探针任务可解释自然语言处理预训练模型深度学习人工智能安全

    基于伪点云特征增强的多模态三维目标检测方法

    孔德明李晓伟杨庆鑫
    759-775页
    查看更多>>摘要:环境感知是自动驾驶汽车落地的关键技术之一,它对于提高自动驾驶汽车的安全性和可靠性至关重要.三维目标检测是其中的一项核心任务,旨在识别和定位三维空间中的物体,为后续决策提供重要的信息.点云和图像是该任务最常用的输入数据,点云由三维空间中不规则分布的点组成,而图像则是由二维空间上规则分布的像素组成.因此,点云和图像之间难以进行有效的融合.而伪点云作为一种点云表征的图像信息,近几年受到了该领域学者的广泛关注.现阶段基于伪点云的三维目标检测方法还存在伪点云特征提取粗糙和相应感兴趣区域(Region-of-Intersts,RoI)特征表征能力差的问题.本文针对上述问题开展研究,分别提出细粒度注意力卷积和多尺度分组稀疏卷积.细粒度注意力卷积将规则图像处理中常用的深度可分离卷积引入不规则点云的处理流程,并在此基础上嵌入通道和分组注意力机制,进行精细的特征提取,增强伪点云特征;多尺度分组稀疏卷积将格网池化后的RoI特征分组,进行差异化特征学习,获取不同尺度的RoI特征,增强伪点云RoI格网特征的表征能力.基于此,本文在SFD(Sparse Fuse Dense)网络的伪点云特征提取流程中引入细粒度注意力卷积,同时在其伪点云RoI特征学习流程中引入多尺度分组稀疏卷积,构建SFD++多模态三维目标检测网络.在权威KITTI自动驾驶数据集上的实验结果表明,SFD++每秒可以处理8.33帧数据,其精度在简单、中等和困难的三维汽车检测上达到95.74%、88.80%和86.04%,比次优SFD的精度高出0.15%、0.84%和0.58%.除此之外,一系列消融和补充实验结果验证了所提出卷积的有效性和相关参数设置的合理性.

    自动驾驶三维目标检测伪点云注意力机制深度可分离卷积组卷积

    基于CNN计算局部复杂度的可逆信息隐藏算法

    胡润文项世军李晓龙欧博...
    776-789页
    查看更多>>摘要:在可逆信息隐藏领域,选择较小的预测误差有助于减少信息嵌入过程引起的失真.现有选择方法主要计算预测误差的局部复杂度,将信息嵌入到局部复杂度小的预测误差中.这些局部复杂度计算方法只使用部分相邻像素计算局部复杂度,且计算方法与预测部分使用的预测器无关,因此其选择性能有待提高.本文提出了一种基于CNN的局部复杂度计算方法LCCN,该方法与预测部分的预测器相关,可以使用更多的相邻像素计算局部复杂度,提高局部复杂度与预测误差的相似性.与现有的局部复杂度计算方法相比,所提LCCN利用了 CNN的多感受野特性和深度学习的全局优化能力,能使用更多相邻像素计算局部复杂度,从而选择更多数值较小的预测误差,提高嵌入算法性能.此外,我们还提出了一种适用于LCCN的两阶段RDH方案,该方案可以将LCCN应用于多种嵌入方法.实验结果表明,与现有的几种局部复杂度计算方法相比,本文所提方法在标准测试图像和Kodak数据集上嵌入性能更好,在基于LPVO的嵌入技术中,本文所提LCCN模型嵌入10000 bits后图像Lena的PSNR为62.09 dB,分别高于LV、FV、EE和LAE算法1.05 dB、1.02 dB、0.78 dB和0.90 dB.与现有的先进RDH算法比较,本文所提LCCN模型在不同图像上均取得较好效果.

    可逆信息隐藏局部复杂度深度学习卷积神经网络预测误差隐私计算

    视觉提示学习综述

    廖宁曹敏严骏驰
    790-820页
    查看更多>>摘要:近年来,随着提示学习方法在自然语言处理领域被提出,其日益受到研究人员广泛关注.它通过将各类下游任务重构成预训练任务的形式,以参数高效和数据高效的方式将大规模预训练模型应用在各类自然语言相关下游任务中.其中以GPT系列为代表的模型通过提示学习在对话生成和多模态图文理解等任务上取得了巨大的成功.然而,这类模型及方法还不能解决视觉中的稠密任务.受此启发,一些研究人员逐渐将提示学习广泛应用到视觉相关的各类任务当中,如图像识别、目标检测、图像分割、领域适应、持续学习等.由于目前还没有提示学习应用在视觉相关领域中的综述,本文将对视觉单模态领域以及视觉语言多模态领域的提示学习方法展开全面论述和分析.作为回顾,我们首先简要介绍自然语言处理领域的预训练模型,并对提示学习的基本概念、下游应用形式以及提示模板类型进行阐述和分类.其次,我们分别介绍视觉单模态领域以及视觉语言多模态领域里提示学习方法适配的预训练模型和任务.再次,我们分别介绍视觉单模态领域以及视觉语言多模态领域的提示学习方法.在自然语言处理领域,提示学习方法以继承预训练形式实现多任务统一为主要目的;与此不同,在视觉相关领域,提示学习方法侧重于面向特定下游任务进行设计.为此,我们将从方法设计上进行简单分类,然后从应用任务角度详细介绍视觉单模态提示学习和视觉语言多模态提示学习方法.最后,我们对比分析了自然语言处理领域和视觉相关领域提示学习研究的进展,并对未来研究路线给出了展望.

    大规模预训练模型自然语言处理视觉单模态提示学习视觉语言多模态提示学习

    基于分布共识的联邦增量迁移学习

    崔腾张海军代伟
    821-841页
    查看更多>>摘要:相同生产工艺的工业过程协同建模是解决工业难测参数在线软测量的有效方法,但因生产原料、设备等因素差异,所形成的分布式数据往往呈现非独立同分布特性(Nonindependent Identically Distribution,Non-ⅡD).同时,受生产环境变化影响,数据分布特性会随时间发生变化.因此,工业建模场景对模型的个性化配置和自主调整能力提出了更高的要求.为此,本文提出一种结构与参数并行优化的联邦增量迁移学习方法(Federated Incremental Transfer Learning,FITL).所提方法在增量式联邦学习框架下,建立了基于模型输出信息的联邦共识组织,并利用横向联邦进行组内增强;进而,面向联邦共识组织,通过最小化组间共识差异增量迁移不同共识组织信息;最后,结合组内横向增强和跨组织迁移学习,构造增量迁移下的联邦学习模型.在工业数据集和基准数据集上的实验结果表明,与现有方法相比,所提模型能更好地实现不同工况Non-ⅡD情况下的协同建模.在过程工业回归任务和公开数据集的分类任务中,FITL能在多工况环境下相较基线方法提升9%和16%的模型预测精度.

    协同建模分布式数据非独立同分布迁移学习联邦学习

    抗拜占庭攻击的隐私保护联邦学习

    穆旭彤程珂宋安霄张涛...
    842-861页
    查看更多>>摘要:联邦学习是一种隐私保护的分布式机器学习框架,可以让各方参与者在不披露本地数据的前提下共建模型.然而,联邦学习仍然面临拜占庭攻击和用户隐私泄漏等威胁.现有研究结合鲁棒聚合规则和安全计算技术以同时应对上述安全威胁,但是这些方案难以兼顾模型鲁棒性与计算高效性.针对此问题,本文提出一种抗拜占庭攻击的隐私保护联邦学习框架SecFedDMC,在保护用户数据隐私的条件下实现高效的拜占庭攻击检测与防御.基础方案FedDMC采用"先降维后聚类"的策略,设计了高效精准的恶意客户端检测方法.此外,该方法利用的随机主成分分析降维技术和K-均值聚类技术主要由线性运算构成,从而优化了算法在安全计算环境中的适用性.针对基础方案存在的用户数据隐私泄露问题,提出了基于安全多方计算技术的隐私增强方案SecFedDMC.基于轻量级加法秘密分享技术,设计安全的正交三角分解协议和安全的特征分解协议,从而构建双服务器模型下隐私保护的拜占庭鲁棒联邦学习方案,以保护模型训练和拜占庭节点识别过程中的用户隐私.经实验验证,SecFedDMC在保护用户隐私的前提下,可以高效准确地识别拜占庭攻击节点,具有较好的鲁棒性.其中,本方案与最先进的鲁棒联邦学习算法相比,在CIFAR10数据集上,拜占庭攻击节点检测准确率提升12%~24%,全局模型精度提升4.45%~18.48%,计算效率提升33.21%~47.31%.

    联邦学习拜占庭攻击安全多方计算隐私保护模型鲁棒性隐私计算

    基于决策边界分析的深度神经网络鲁棒性评估与优先次序验证

    林韧昊周清雷扈天卿王一丰...
    862-876页
    查看更多>>摘要:随着深度学习技术在现实世界的广泛应用,人们对基于深度神经网络的系统安全性提出了更高要求.鲁棒性是神经网络的重要安全性质,对网络鲁棒性的量化分析和验证是深度学习模型安全性研究的关键问题.针对神经网络验证技术中难以解决的效率问题,提出了一种新颖的优先次序优化方法.结合局部鲁棒性的规约方式,在一组待验证输入内选择具有更高验证需求的不稳定点代替常规的逐点验证模式.根据对鲁棒性问题与决策边界距离的关联性分析,提出了一种基于网络输出单元值大小的鲁棒性评估方法作为优先验证的输入点选择依据.在此基础上将其扩展为输入的预分析模块与验证工具集成,进而设计了基于优先次序的验证框架.在常用的验证基准上进行了实验,结果表明,该方法的决策边界分析理论与突变测试结果一致,鲁棒性评估中选择不安全样本的平均准确率高于90%,通过减少安全样本的验证开销使验证效率提高了 148.6%~432.6%.

    深度神经网络鲁棒性验证优先次序模式决策边界鲁棒性度量指标

    MagDet:基于地磁的无人机GPS欺骗检测方法

    魏晓敏李兴华孙聪张海宾...
    877-891页
    查看更多>>摘要:GPS是目前最为广泛使用的基于卫星的导航和定位系统,对于无人机而言,它是一个不可或缺的组成部分,提供了关键的精确位置数据,对导航和任务的成功至关重要.然而,GPS欺骗攻击已经逐渐演变成对GPS依赖系统不断增加的威胁.目前,针对无人机的GPS欺骗检测方法大多基于仿真数据提出、依赖于多个无人机或者需要专用设备(例如,软件定义无线电平台和高清摄像头).本文提出一种新颖的基于地磁场的无人机GPS欺骗检测方法——MagDet(Magnetic field-based Detection method),其基本思想是利用地球内部和周围金属建筑材料不均匀性引起的地磁场异常,通过真实飞行收集位置和磁场强度数据,包括正常和被攻击场景.应用各种机器学习算法来训练这些数据以选择最佳分类器,该分类器可以轻松部署在常见机载计算机中.该方法的检测率超过99.5%,平均错误率(Equal Error Rate,EER)为0.51%,优于现有检测方法.此外,评估了各种因素对MagDet的影响,以证明其鲁棒性.即使在未访问过的地点(距离6 km),准确率也高于95%,EER为0.49%.

    GPS欺骗检测地磁无人机GPS欺骗攻击机器学习

    基于揭序加密的联邦决策树安全比较协议

    韩朝阳葛春鹏刘哲方黎明...
    892-906页
    查看更多>>摘要:得益于联邦学习的发展,多个参与方得以越来越方便地在保护隐私的前提下协同训练多种机器学习模型.随着联邦学习训练方案的逐渐成熟,在这些模型上进行高效联邦预测任务的需求也日益受到关注.目前对联邦学习得到模型的应用的研究大都处于复用训练范式的范畴,而实际上这一做法造成了额外的开销,联邦预测任务存在着极大的效率提升空间.本文对基于树模型的外包预测服务进行研究.首先明确阐述了"联邦预测"任务,并指出设计高效解决方案面临着数据异构分布和用户数据动态变化的挑战.针对这些挑战,本文提出了新颖的安全比较协议OREC.OREC通过一个不可信的第三方的协助,使得两个参与方得以秘密地比较他们的私密值.所设计的协议基于揭序加密,其通过公开函数可以揭示出密文之间的顺序关系.为了增强其隐私性,我们进一步设计了一次一密机制并引入了混淆密码序列技巧.我们对协议进行了全面的安全性分析,并证明了其面对恶意第三方的鲁棒性.此外,我们还通过大量实验验证了所提出协议的高效性和可扩展性.

    联邦学习联邦预测安全比较揭序加密外包计算隐私计算