首页期刊导航|计算机学报
期刊信息/Journal information
计算机学报
计算机学报

高文

月刊

0254-4164

cjc@ict.ac.cn

010-62620695

100190

中国科学院计算技术研究所(北京2704信箱)

计算机学报/Journal Chinese Journal of ComputersCSCD北大核心CSTPCDEI
查看更多>>本刊是中国计算机领域的有代表性学术刊物,作为一种科学研究档案,代表了计算机领域各个研究阶段的水平。本刊被《工程索引》(美国)、《科学文摘》(英国)、《数学文摘》(美国)、《科技文献速报》(日本)、《文摘杂志》(俄罗斯)等多种权威系统收录。是科技部科技信息研究所科技论文统计源期刊、中国科学引文数据库来源期刊。
正式出版
收录年代

    基于强化学习的任务型对话策略研究综述

    徐恺王振宇王旭秦华...
    1201-1231页
    查看更多>>摘要:对话系统在自然语言处理中发挥着重要作用,具有较好的实际应用前景和许多值得研究的方向.对话策略是基于管道方法的人机对话系统的核心组件,能够根据对话状态生成响应动作,进而指导对话生成.对话策略学习常建模为(半)马尔可夫决策过程,然后通过强化学习求解.近年来,基于强化学习算法解决任务型对话策略问题的研究层出不穷,而相关综述缺乏.因此,本文对基于强化学习的任务型对话策略进行分析、归类、总结.首先,介绍分类强化学习的一般模型,并基于强化学习的分类,分析并总结现有对话策略学习的一般思路和存在问题;其次,基于不同的研究热点,包括多领域、多模态、多代理和共情对话策略,深度剖析新近研究的理论模型、研究进展和存在的问题;接着,针对对话策略的相关研究,包括用户模拟器、对话策略评估、对话策略平台与数据集以及大语言模型与对话策略等进行介绍;针对现有研究的不足,本文从5种不同的角度分析了对话策略的未来研究方向;最后,对全文进行总结与展望.本文不仅从强化学习分类上概述任务型对话策略,而且从应用的角度分类任务型对话策略,全方面、多角度地综述了任务型对话策略,为未来的任务型对话策略的研究提供启示.

    对话策略强化学习任务型对话系统深度强化学习多领域多模态

    基于神经切线核的学件RKME规约

    谭志豪史浩宇陈梓轩姜远...
    1232-1243页
    查看更多>>摘要:当前机器学习技术已经在大量领域得到广泛应用,然而仍面临许多亟待解决的问题:依赖大量的训练数据和训练技巧、难以适应环境变化、数据隐私/所有权的保护、灾难性遗忘等等.最近,学件范式使得上述问题同时得到系统性地解决成为可能.在该范式下,用户面临新的机器学习任务时可以通过学件基座系统方便地复用他人的结果,而不必从头开始.学件范式的核心在于规约,规约使得学件基座系统在不接触原始数据的情况下,可以根据用户的需求快速识别出对用户任务有帮助的学件.近期研究均通过缩略核均值嵌入(Reduced Kernel Mean Embedding,RKME)为模型构造规约,并通过构建学件原型系统验证了范式的有效性.在实际中,学件基座系统中往往包含在各种领域任务、数据类型上构建的机器学习模型,而传统的RKME规约面临维度灾难的问题,难以适用于高维数据,例如图像场景.为了拓展RKME规约的适用范围,本文引入神经切线核进行RKME规约构造.为提升方法的高效性,本文进一步通过神经网络高斯过程与随机特征近似,快速为各种模型生成RKME规约.最后,本文在真实数据构建的销量预测、图像分类场景的学件基座系统中进行大量实验验证了所提出方法的有效性和高效性,所提出方法相比于传统RKME规约查搜准确率显著提升近9%,且实验结果表明改进后的规约在图像任务上具有良好的隐私保护性质.代码见:https://github.com/tanzh-lamda/RKME-NTK.

    学件学件基座系统规约神经切线核缩略核均值嵌入

    文本分类算法及其应用场景研究综述

    刘晓明李丞正旭吴少聪张宇辰...
    1244-1287页
    查看更多>>摘要:随着大数据时代的到来,互联网中的文本信息迎来了井喷式的增长.文本分类作为自然语言处理中最重要的技术之一,其广泛应用于多个领域,如情感分析、新闻分类、自然语言推理、主题标记、抽取式问答、虚假内容检测等.从传统机器学习分类方法理论的深入到深度学习分类方法探索的兴起,相关研究模型与思路也在不断演变,各类新的方法、数据集和评价指标层出不穷,丰富了文本分类领域的研究,取得了卓越的理论成就和应用效果.尽管如此,新技术不断发展和业务应用场景不断丰富,同时,也为文本分类研究带来了许多新的问题与挑战,如数据约束场景中不均衡数据的文本表征学习、小样本场景下的文本分类等.针对当前研究难题与挑战,本文对文本分类方法进行了系统性调研,并对当前方法在实际应用场景中面临的技术挑战和未来的研究方向进行了综合探讨.具体而言,本文主要综述了七部分内容,分别是:(1)对文本分类技术的相关基础知识进行了全面介绍,包括文本分类的常见符号定义、计算范式和文本预处理技术;(2)对基于传统机器学习的文本分类方法进行了详细总结;同时,为了方便读者针对不同的应用场景选择合适的分类模型,本文对不同分类器擅长处理的文本分类难题及方法优劣进行了总结;(3)对基于新兴深度学习的文本分类方法进行了周详梳理,根据领域内代表性技术的核心思想进行分类,在此基础上对不同类别下的主要方法进行描述,同时对其技术的优劣进行了总结;(4)为了方便读者对文本分类模型的有效性进行验证,针对文本分类技术应用最为广泛的七大场景,本文对相关数据集进行了系统性的总结;(5)本文对不同任务目标下的常用的模型评价方法进行详尽介绍,以便对模型性能进行合理的定量评估;(6)基于上述内容,本文对典型应用场景中不同种类文本分类算法进行了性能总结对比;(7)本文分别从数据约束与模型计算两个层面对当前文本分类技术所面临的挑战和未来的重要研究方向进行了总结.本文通过梳理文本分类研究发展脉络,对涉及的代表性技术进行了详细总结和对比分析,有效填补了文本分类领域前沿技术的应用综述空白.

    文本分类机器学习深度学习评价指标数据约束

    用户生成内容场景下角色导向图神经推荐方法

    娄铮铮朱军娇张万闯吴宾...
    1288-1303页
    查看更多>>摘要:近年来互联网的飞速发展不断改变着信息的生产和传递方式,随之出现了用户使用互联网的新方式——用户生成内容(User-Generated Content,UGC).该场景中内容以传播速度快、获取成本低等优势迅速占据互联网信息传播的重要地位.不同于传统推荐场景,UGC场景下用户同时扮演生产者和消费者双重角色,这使得在构建推荐模型时既需要考虑消费者与内容之间的交互信息,也需关注内容生产者对于消费者决策的影响.因此,UGC场景下个性化推荐算法研究的关键在于如何充分挖掘消费者-内容和消费者-生产者之间的关联关系.在面向UGC场景的推荐研究中,比较有代表性的模型为CPRec,该模型虽取得一定进展,但仍存在两点不足之处.其一,在模型构建层面,未能显式建模消费者-内容与消费者-生产者之间的高阶连通关系,难以学习出高质量的节点表征.其二,在模型优化层面,无法区分每个观测数据在不同训练阶段的贡献度,将影响推荐结果的质量.为此,本文提出一种新颖的角色导向图神经推荐方法RGNRec(Role-Guided Graph Neural Recommendation)用于UGC场景的个性化排序任务.特别地,基于用户的历史行为数据与内容的创作者信息分别构建了消费者-内容交互图和消费者-生产者交互图.进一步,为了显式捕获两种交互图中的高阶连通信息,构建一种双通道线性传播模块,同时刻画了消费者兴趣与内容生产者影响的扩散过程.最终,提出设计一种自适应的正样本权重生成策略,将其融入非采样损失函数,并建立双层优化机制来学习模型的参数.本文的核心贡献包括:(1)引入双通道线性传播模块,以显式解耦出自身兴趣与内容生产者效应对于用户偏好建模的不同贡献度;(2)提出权重自适应的非采样损失函数,以解决不同观测样例在模型不同训练阶段贡献不同的问题.本文分别采用经典的和最先进的图神经网络方法作为基准,在3个UGC场景Pinterest、Recipes和Reddit下进行了实验对比.在整体推荐性能方面,无论模型精度亦或训练效率上均优于各基准方法,尤其在Precision@10指标上获得了 4.31%~17.83%的提升;然后通过消融实验验证了双通道线性传播模块和权重自适应优化机制的合理性与必要性;最后通过实验验证了本文方法在缓解数据稀疏和用户冷启动方面的优越性.

    推荐系统图神经网络用户生成内容双重角色非采样学习

    基于价值函数分解和通信学习机制的异构多智能体强化学习方法

    杜威丁世飞郭丽丽张健...
    1304-1322页
    查看更多>>摘要:许多现实世界的系统可以被建模为多智能体系统,多智能体强化学习为开发这些系统提供了一种有效的方法,其中基于集中训练与分散执行范式的价值函数分解方法得到了广泛的研究.然而现有的价值分解方法一般缺乏通信机制,在处理需要通信学习的多智能体任务时表现不佳.同时,目前大多数通信机制都是针对同构多智能体环境设计的,没有考虑异构多智能体场景.在异构场景中,由于智能体动作空间或观测空间的异构性,智能体之间的信息共享并不直接.如果不能对智能体的异构性进行有效地建模处理,通信机制将变得无效,甚至会影响多智能体的协作性能.为了应对这些挑战,本文提出一个融合价值函数分解和通信学习机制的异构多智能体强化学习框架.具体地:(1)与采用同构图卷积网络的方法不同,该框架利用异构图卷积网络融合智能体的异构特征信息得到有效的嵌入;(2)利用通信学习模块获得的嵌入信息和局部观测历史计算每个智能体的动作价值,以选择和协调智能体的动作;(3)通过设计的互信息损失函数和价值函数分解模块的损失函数联合训练,能够有效地训练整个方法.本文首先在两个异构多智能体平台上进行实验,实验结果表明该方法能学到比基线方法更有效的策略,在两个平台上相比基线方法分别提高了 13%的平均奖励值和24%的平均胜率.此外,在交通信号控制场景中验证了该方法在现实系统中的可行性.

    价值函数分解异构多智能体强化学习通信机制图神经网络互信息交通信号控制

    基于局部时空的多峰优化算法及其在PID控制中的应用

    赵宏李珈瑞刘静
    1323-1340页
    查看更多>>摘要:多峰优化问题(MultiModal Optimization Problems,MMOPs)需要同时找到问题的多个高精度全局最优解,它需要算法具有较强的全局搜索能力且能很好地平衡种群的多样性和收敛性.当前在处理MMOPs时通常面临以下难点:(1)现有方法通常只考虑到进化过程中种群的当前状态(如常用的贪婪选择策略),容易导致种群陷入局部最优;(2)传统的随机搜索策略在复杂搜索空间内难以快速有效找到全局最优解;(3)当前设计的多峰优化算法往往需要手工设置参数(如变异因子和交叉因子等),而参数的大小将直接影响种群的多样性和收敛性.针对上述难点,本文提出了一种新的基于局部时空的多峰优化(Localized Time-Distance-based Multimodal Optimization,LTDMO)算法,主要包括三个贡献点:首先,提出了结合随机搜索和定向引导的变异(Random and Direction-based Mutation,RDM)策略,利用随机变异增加种群中个体的多样性,并通过划分邻域将整个种群分成不同的可重叠子种群,在局部搜索空间内进行变异操作来更好地定位全局最优解,从而避免个体陷入局部最优.其次,提出了基于时间局部性原理的拥挤选择(Locality-based Crowding Selection,LCS)策略,利用进化过程中的时间局部性记录对当前个体更有潜力的进化方向,并在此方向上生成新的子代,使种群进一步向全局最优解收敛.最后,提出了自适应参数控制(Self-adaptive Parameter Control,SPC)策略,基于个体进化信息自适应调整算法的参数值,降低算法在进化过程中对变异因子和交叉因子的参数敏感性.本文将LTDMO算法在CEC'2013测试集上进行实验,并将结果与其他11种多峰优化算法对比,表明LTDMO算法能有效处理较多的全局最优复杂多峰优化问题,具体地,在F1~F5、F8和F10问题上峰值率和成功率均达到100%;在具有较多局部最优的多峰优化问题(F6和F7)上,LTDMO算法的峰值率达到86%以上,这优于9种其他对比算法的性能;在处理复合多峰优化问题时,LTDMO算法在处理F11、F12、F14、F16问题上性能达到最优.同时将LTDMO算法在比例-积分-微分(Proportional-Integral-Derivative,PID)控制器上进行应用,结果表明LTDMO算法能为PID控制器找到多种最优控制参数,使系统达到稳定状态且误差更小.

    多峰优化问题邻域变异时间局部性自适应调整参数PID控制

    求解加权偏MaxSAT问题的通用子句加权方法

    郑迥之何琨
    1341-1354页
    查看更多>>摘要:最大可满足性问题(Maximum Satisfiability Problem,MaxSAT)是著名的可满足性问题(Satisfiability Problem,SAT)的优化形式,也是一个经典的NP难组合优化问题.加权偏MaxSAT(Weighted Partial MaxSAT,WPMS)是最一般的一类MaxSAT问题,其中包含了必须要满足的硬子句,对应了优化问题中的约束条件,以及带权重的软子句,对应了优化问题中的优化目标.WPMS旨在满足所有硬子句的同时最大化被满足软子句的权重之和.工业场景中和学术领域中的许多优化问题都能够转化成WPMS问题进行求解,因此WPMS具有广泛的应用领域和重要的研究意义.局部搜索方法是求解WPMS问题的一种著名且被广泛研究的非完备方法.子句加权技术是WPMS局部搜索算法中常用的一种有效且关键的技术,通过为子句赋予动态权重并在搜索过程中更新它们以引导搜索方向,帮助算法逃离局部最优.最先进的WPMS局部搜索算法都提出或采用了有效的子句加权技术,以帮助它们在不同的解空间中搜索.然而,现有的子句加权技术仅根据当前局部最优解更新子句动态权重,而未考虑任何历史信息,可能导致子句加权的视野局限,对搜索方向的引导不够准确.为了解决这一问题,提出了一种新的子句加权技术,称为Hist-Weighting(Clause Weighting with Historical Information),同时考虑了当前及历史信息来更新子句的动态权重,以改进子句加权机制和局部搜索算法的搜索精度和效率.具体而言,Hist-Weighting为那些同时被当前和历史局部最优解所不满足的子句赋予更大的动态权重增量,使算法更倾向于满足那些久未被满足且难以被满足的子句,提高子句加权的准确度.此外,在Hist-Weighting中,子句动态权重的增量能够根据子句中的变元得分自适应地调整,使子句加权更具有灵活性.Hist-Weighting还为子句动态权重的增量设置了上下限,保证了子句加权的稳定性.为了评估所提出的Hist-Weighting子句加权技术的性能,将其应用于三种最先进的WPMS局部搜索算法,即BandMaxSAT、SATLike3.0和CCEHC.在近五届 MaxSAT国际算法竞赛 MaxSAT Evaluation非完备组的所有WPMS算例上的实验结果表明,应用Hist-Weighting技术的改进算法相比于原算法在获胜算例数上能够提升约10%至60%,体现了所提出的Hist-Weighting子句加权技术在求解WPMS问题时的有效性.此外,通过将应用了 Hist-Weighting的改进局部搜索算法与其变体算法对比以进行消融实验,表明了 Hist-Weighting中限制动态权重增量上下限,以及使动态权重增量根据变元得分自适应调整的机制的有效性.

    最大可满足性问题局部搜索子句加权技术历史信息

    基于最大均值差异的能量侧信道泄露量化评估

    洪亮翟元洁王嘉熙郑健...
    1355-1371页
    查看更多>>摘要:能量侧信道分析是通过对密码设备运行时的能量消耗进行分析,推导出运行时的操作及操作涉及的敏感中间值.对密码设备进行能量泄露量化评估是分析密码设备信息泄露程度的重要手段,目前主流的评估方案主要关注于能量迹上单个样本点的泄露,并未充分考虑高阶攻击模型下的泄露评估问题,对于采用掩码防御措施的密码芯片来说,一旦发生泄露,通常表现为多变量联合泄露,因此采用传统的单样本点方法进行泄露评估会存在假阴性的问题.本文研究多点联合泄露评估问题,引入最大均值差异方法,提取能量迹的多变量联合特征,构建基于最大均值差异的能量泄露量化评估模型,提供了一种有效的能量侧信道泄露量化评估方法.通过实现无防御对策和有防御对策的AES算法,使用DPA contest v2、ASCAD v1和自采能量迹数据集进行实验,结果表明,基于最大均值差异的泄露量化评估方法能够有效降低单样本点检测方法出现假阴性的风险,HAC、MTD和Bartlett-F检验的对照结果也进一步验证了该方法的有效性.

    能量侧信道信息泄露量化评估最大均值差异掩码AES

    一种基于风险代码抽取的控制流保护方法

    李勇钢钟叶青郑伊健林果园...
    1372-1392页
    查看更多>>摘要:代码复用攻击是控制流安全面临的主要威胁之一.虽然地址分布随机化能够缓解该攻击,但它们很容易被代码探测技术绕过.相比之下,控制流完整性方法具有更好的保护效果.但是,现有的方法要么依赖于源码分析,要么采用无差别跟踪的方式追踪所有的控制流转移.前者无法摆脱对源码的依赖性,后者则会引入巨大的运行时开销.针对上述问题,本文提出一种新的控制流保护方法MCE(Micro Code Extraction).MCE的保护目标是源码不可用的闭源对象.与现有的方法相比,MCE并不会盲目地追踪所有的控制流转移活动.它实时地检测代码探测活动,并仅将被探测的代码作为保护目标.之后,MCE抽取具有潜在风险的代码片段,以进一步缩小目标对象的大小.最后,所有跳转到风险代码中的控制流都会被追踪和检测,以保护它的合法性.实验和分析表明,MCE对代码探测和代码复用攻击具有良好的保护效果,并在一般场景下仅对CPU引入2%的开销.

    代码探测代码复用攻击控制流劫持代码抽取内存访问控制

    求解最小公倍数问题的量子安全多方计算协议

    李子贤刘文杰
    1393-1412页
    查看更多>>摘要:最小公倍数是解决很多数学问题的基础工具,在隐私保护的情况下如何对其进行多方协同计算具有一定的研究价值.部分经典安全多方计算协议虽然能够求解该问题,但计算复杂度为指数级.本文通过将最小公倍数问题转化为求多个周期函数的连接函数的周期,提出了一个基于量子周期查找算法的最小公倍数协议,将复杂度降为多项式级.在协议中,发起方对每个参与方发送一个粒子.每个参与方对粒子施加一个Oracle操作,其中Oracle函数的周期即各自的私有整数.然后,发起方通过运行量子周期查找算法来计算出连接函数的周期,即各自整数的最小公倍数.为了防御共谋和伪造攻击,采用星-环混合拓扑结构对粒子发送方进行诚实性检验.由于量子周期查找算法存在一定的失败概率,设计了一个量子匿名输出检验协议来检验最小公倍数结果的正确性.安全性分析表明了该协议在恶意模型下具有无条件安全性,且协议的计算复杂度和通信复杂度分别为O(n3m2log(nm))和O(n2mlog(nm)),均为多项式级.此外,该协议具有较好的扩展性,可应用于安全多方最大公约数计算、有理数求和、最值计算等问题.

    量子计算量子信息安全多方计算最小公倍数量子周期查找算法匿名输出检验隐私计算