首页期刊导航|计算机学报
期刊信息/Journal information
计算机学报
计算机学报

高文

月刊

0254-4164

cjc@ict.ac.cn

010-62620695

100190

中国科学院计算技术研究所(北京2704信箱)

计算机学报/Journal Chinese Journal of ComputersCSCD北大核心CSTPCDEI
查看更多>>本刊是中国计算机领域的有代表性学术刊物,作为一种科学研究档案,代表了计算机领域各个研究阶段的水平。本刊被《工程索引》(美国)、《科学文摘》(英国)、《数学文摘》(美国)、《科技文献速报》(日本)、《文摘杂志》(俄罗斯)等多种权威系统收录。是科技部科技信息研究所科技论文统计源期刊、中国科学引文数据库来源期刊。
正式出版
收录年代

    基于混合阶相似性的多视图聚类:一个广义的视角

    陈曼笙任骊安王昌栋黄栋...
    1453-1468页
    查看更多>>摘要:多视图聚类已经被广泛研究,它能够采用可用的多源信息来实现更好的聚类性能.然而,大多数之前的工作仍存在两个不足:(1)它们通常关注多视图属性特征的场景,很少留意到多视图属性图数据;(2)它们主要尝试发现一致的结构或多个视图之间的关系,而忽略了多视图观测之间潜在的高阶相关性.为了解决这些问题,我们从广义角度出发,提出了一种新颖的方法,称为混合阶相似性的多视图聚类(Multiview Clustering by Hybrid-order Affinity,MCHA).它将结构图和多视图属性特征巧妙融合,同时考虑了低秩概率相似性图和混合阶的相关性.具体而言,我们通过图过滤策略构建了一组保留几何结构的视图特定的平滑表示.同时,我们将从平滑表示中学习得到的多视图概率相似性图堆叠成一个张量,并对该张量给予低秩属性的约束.这可以很好地恢复视图间更高阶的相关性.在八个基准数据集上的实验表明,我们所提出的MCHA方法具有最先进的有效性.

    多视图聚类概率相似性图低秩张量高阶相关性

    基于Transformer结构增强的神经网络架构搜索性能预测器

    王继禾吴颖迟恒喆王党辉...
    1469-1484页
    查看更多>>摘要:神经网络架构搜索(Neural Architecture Search,NAS)作为一种通过搜索算法设计神经网络架构的方法,在计算机视觉和自然语言处理等领域得到广泛应用,相较于人工设计网络,NAS方法可以减少设计成本并提高模型性能.但是NAS的性能评估需要对候选架构进行大量训练,由此带来的计算量占整个NAS的80%以上.为降低计算开销和时间成本,近年来已提出许多基于Transformer的NAS预测器,由于Transformer出色的结构编码能力可以更好地表示拓扑信息,因而得到广泛应用.但是,现有基于Transformer的NAS预测器依然存在三个问题:其一是在预处理阶段,传统的One-hot编码方式描述节点特征的能力较弱,只能区分不同操作节点类型,而难以表达操作的细节特征,如卷积核尺寸等.其二是在编码阶段,Transformer的自注意力机制导致模型结构信息缺失;其三是在评估阶段,现有的Transformer预测器仅使用多层感知机(Multilayer Perceptron,MLP)对前向传播图进行精度预测,忽略了反向传播梯度流对预测精度的影响,因此难以真正拟合NAS评估中的正、反向交替信息流图,导致预测器精度与实际运行精度误差波动极大(10%~90%).为解决上述问题,本文提出了一种基于Transformer结构增强的NAS性能预测方法.首先,在预处理阶段,本文提出了一种超维嵌入方法增加输入数据维度以强化节点操作的参数描述能力,其次,在编码阶段将Transformer编码后的信息与图结构信息共同输入一个图卷积网络(Graph Convolutional Network,GCN),弥补由自注意力机制引起的结构缺失.最后,在性能评估阶段,本文构建了同时包含前向传播和反向传播的全训练图,并将数据集信息、图结构编码与梯度编码共同输入到GCN网络预测器中,使预测结果更贴近模型真实性能.实验结果表明,本方法与目前最先进方法相比,肯德尔相关系数提高了7.45%,训练时间减少了 1.55倍.

    预测器NASTransformerGCNEmbedding

    基于深度学习的图像匹配:方法、应用与挑战

    孔庆群吴福朝樊彬
    1485-1520页
    查看更多>>摘要:图像匹配旨在建立图像之间的点对应关系,是许多计算机视觉任务的关键环节.近年来,随着深度学习技术的发展,图像匹配方法已从以手工设计特征为主转变为基于深度网络的方法,基于深度学习的图像匹配方法在多个标准数据集上展现出卓越的性能,推动着多个相关应用的发展.围绕图像匹配涉及的若干关键问题,如:特征点检测、特征点描述、稠密点匹配、误匹配去除,本文对深度学习图像匹配方法进行了系统性总结.首先分析了领域内基于深度学习的典型方法和关键技术,随后介绍了与图像匹配密切相关的几个典型应用并给出其现状分析,最后,根据对图像匹配领域技术发展的分析总结,结合作者在该领域的长期研究积累,本文给出了目前图像匹配所面临的主要挑战以及未来发展趋势.

    图像匹配特征点匹配稠密匹配三维重建视觉定位同时定位与建图深度学习

    一种基于强化学习的自适应多邻域人工蜂群算法

    周新宇尹子悦高卫峰谭贵森...
    1521-1546页
    查看更多>>摘要:邻域拓扑是提高人工蜂群算法性能的一种有效手段.然而,现有相关工作主要是在种群层次上实现了单一邻域拓扑,这种方式忽略了不同类型的邻域拓扑能优势互补,使得算法性能还有一定局限性.为此,本文结合强化学习,提出在个体层次上实现多邻域拓扑.将种群中的个体视作智能体,设计了基于邻域拓扑的状态和动作,选用4种不同特征的邻域拓扑用于构建邻域候选池,之后采用Q-learning方法根据个体的奖励情况为其自适应选择不同的邻域拓扑.该方式相对于现有的单一邻域拓扑,更能充分发挥不同邻域信息对算法搜索的引导作用.在CEC2013和CEC2017两套测试集以及两个实际优化问题上进行了大量实验,与4种邻域相关ABC和4种知名改进ABC进行了性能对比,结果表明该算法的收敛精度和速度均有更好表现,可有效增强邻域人工蜂群算法的性能.

    群智能人工蜂群个体强化学习邻域拓扑

    多智能体深度强化学习研究进展

    丁世飞杜威张健郭丽丽...
    1547-1567页
    查看更多>>摘要:深度强化学习(Deep Reinforcement Learning,DRL)在近年受到广泛的关注,并在各种领域取得显著的成功.由于现实环境通常包括多个与环境交互的智能体,多智能体深度强化学习(Multi-Agent Deep Reinforcement Learning,MADRL)获得蓬勃的发展,在各种复杂的序列决策任务上取得优异的表现.本文对多智能体深度强化学习的工作进展进行综述,主要内容分为三个部分.首先,我们回顾了几种常见的多智能体强化学习问题表示及其对应的合作、竞争和混合任务.其次,我们对目前的MADRL方法进行了全新的多维度的分类,并对不同类别的方法展开进一步介绍.其中,我们重点综述值函数分解方法,基于通信的MADRL方法以及基于图神经网络的MADRL方法.最后,我们研究了 MADRL方法在现实场景中的主要应用.希望本文能够为即将进入这一快速发展领域的新研究人员和希望获得全方位了解并根据最新进展确定新方向的现有领域专家提供帮助.

    多智能体深度强化学习基于值函数基于策略通信学习图神经网络

    数据表示的相关性度量方法

    刘吉元刘新旺蔡志平祝恩...
    1568-1581页
    查看更多>>摘要:数据表示之间的相关性度量是机器学习和人工智能技术的基石.然而现有的度量方法要么数据表示的全局信息考虑不足,要么复杂度较高,限制了相关技术的进一步发展.为解决上述问题,本文提出一种数据表示的对齐度量方法,称为表示对齐(Representation Alignment,RA).此度量方法能够全局性地衡量任意两个数据表示之间的相关性,且其在样本数量和特征维度上的计算复杂度均为线性.在此基础上,我们将RA扩展到了对比学习领域,进一步提出了基于对比的表示对齐(Contrastive Representation Alignment,CRA)度量方法.上述两个度量方法可自然地用于多视图学习场景,即可通过最大化不同视图数据之间的RA和CRA来融合各个视图之间的信息.为验证这一点,我们还提出了两个新颖多视图聚类算法,并在七个基准数据集上取得了领先的聚类性能.

    表示对齐对比学习多视图聚类

    基于双视角建模的多智能体协作强化学习方法

    刘全施眉龙黄志刚张立华...
    1582-1594页
    查看更多>>摘要:在多智能体协作领域,强化学习算法通过共享智能体的局部信息来实现智能体间的协作.但共享协作机制极易引发过度协作问题,导致智能体忽视自身局部观测信息,丧失策略多样性,最终陷入低效协作的困境.为了解决该问题,本文提出基于双视角建模的多智能体协作强化学习方法(Bi-View Modeling Collaborative Multi-Agent Reinforcement Learning,简称BVM-CMARL).该方法从局部和全局两个视角对智能体进行建模,分别用于产生多样性的策略和激励协作.在局部视角最大化局部变分与自身轨迹的互信息,激励智能体的策略多样性;同时在全局视角最大化全局变分与其他智能体动作的互信息,提高智能体协作水平.最后将局部变分训练出的局部Q值与全局变分训练出的全局Q值合并,避免低效协作.将BVM-CMARL算法应用于星际争霸多智能体挑战赛(StarCraft Multi-Agent Challenge,SMAC)中的等级觅食(Level-Based Foraging,LBF)和走廊(Hallway)等环境,与 QMIX、QPLEX、RODE、EOI和MAVEN等5种目前优秀的强化学习算法相比,BVM-CMARL算法具有更好的稳定性和性能表现,在SMAC上的平均胜率为82.81%,比次优算法RODE高13.42%.通过设计模型变体,在消融实验中证明了双视角建模对BVM-CMARL的必要性.

    深度强化学习多智能体系统多智能体协作协作建模对比学习

    最小负载受限k-中位问题的近似方案

    张震冯启龙徐雪松刘利枚...
    1595-1614页
    查看更多>>摘要:摘 要 给定度量空间中的用户集合C和带有最小负载τ:F-(0,|C|]的设施集合F以及正整数k,最小负载受限k-中位问题的一个可行解(H,σ)由满足|H|≤k的开设设施集合H⊆F和满足|σ-1(f)|≥τ(f)∀f∈H的映射σ:C→H组成.(H,σ)的费用为 ∑c∈Cδ(c,σ(c)),其中,δ(c,σ(c))为c与σ(c)之间的距离.最小负载受限k-中位问题的目标是找到费用最低的可行解.本文以A作为固定参数研究最小负载受限k-中位问题的求解算法.本文首先利用D-采样方法寻找与最优解中的开设设施较为接近的用户,然后围绕这些用户划分空间并选取开设设施.给定满足C∪F⊂Rd的实例(C,F,k,τ)和常数ε∈(0,1),本文结合上述思路和降维方法提出了时间复杂度为O(ndk+(kε-1)kε-O(1)nO(1))的(1+ε)-近似算法,其中,n=|C∪F|.此前,人们在固定参数时间内得到的关于该问题的最好近似结果为3+ε;只有在设施可以被开设在欧几里得空间中的任意位置且所有设施最小负载都相等的实例中,存在固定参数时间的(1+ε)-近似算法.

    固定参数算法近似算法设施选址k-中位D-采样

    用平面六边形割角的细分曲面生成方法

    韩臻
    1615-1639页
    查看更多>>摘要:平面六边形是一种更契合自然并具有独特优点的多边形,找到一种方便实用的平面六边形细分格式是细分曲面研究领域中的基础工作之一.本文提出了一种平面六边形细分方法,对任意初始凸多面体网格,只用平面六边形进行割角细分,可以使得细分曲面光滑、保凸、具有插值性质,且细分过程中新增的面片都是平面六边形.我们将该方法简称为平面蜂窝细分.论文给出了平面蜂窝细分的拟线性四点格式几何规则及其细分矩阵,其几何意义直观,相应的算法简单、可行且数值稳定.论文分析了细分曲面的收敛性和光滑性,给出了 C1光滑性条件及其证明.为了提高细分曲面的光滑性,传统的方法是使边数不同的多边形面片按等比例收缩,该方法对于平面蜂窝细分没有预期效果并且无法处理三角形特殊面;论文给出了一种新方法,获得的割角参数使得细分曲面更加光滑,且可以统一处理三角形、四边形等特殊面,从而避免特殊点/面带来的局限性.论文还提出了平面蜂窝细分方法的一种推广和一种自然边界处理方法,并讨论了平直边界和退化情形下尖锐特征生成的方式,可用于细分任意可定向初始网格.文中给出了一些细分曲面的例子,并与经典的细分方法进行了比较,验证了新方法的有效性和具有的优点.

    细分曲面六边形网格平面六边形保凸割角割角参数特殊点/面

    一种基于HTTP/3传输特性的加密视频识别方法

    吴桦倪珊珊罗浩程光...
    1640-1664页
    查看更多>>摘要:视频流量逐渐在网络中占据主导地位,且视频平台大多对其进行加密传输.虽然加密传输视频可以有效保护用户隐私,但是也增加了监管有害视频传播的难度.现有的加密视频识别方法基于TCP(Transmission Control Protocol)传输协议头部信息和HTTP/1.1(Hypertext Transfer Protocol Version 1.1)的传输模式,提取应用层音视频数据单元传输长度序列来实现视频识别.但是随着基于UDP(User Datagram Protocol)的QUIC(Quick UDP Internet Connections)协议及基于 QUIC 实现的 HTTP/3(Hypertext Transfer Protocol Version 3)协议应用于视频传输,已有方法不再适用.HTTP/3协议缺少类似TCP的头部信息,且使用了多路复用机制,并对几乎所有数据进行了加密,此外,视频平台开始使用多片段合并分发技术,这给从网络流量中精准识别加密视频带来了巨大挑战.本文基于HTTP/3协议中的控制信息特征,提出了从HTTP/3加密视频流中提取数据传输特征并进行修正的方法,最大程度复原出应用层音视频长度特征.面向多片段合并分发导致的海量匹配问题,本文基于明文指纹库设计了键值数据库来实现视频的快速识别.实验结果表明,本文提出的基于HTTP/3传输特性的加密视频识别方法能够在包含36万个真实视频指纹的YouTube大规模指纹库中达到接近99%的准确率、100%的精确率以及99.32%的F1得分,对传输过程中加入了填充帧的Facebook平台,在包含28万个真实视频指纹的大规模指纹库中达到95%的准确率、100%的精确率以及96.45%的F1得分,在具有同样特性的Instagram平台中,最高可达到97.57%的F1得分,且本方法在所有指纹库中的平均视频识别时间均低于0.4秒.本文的方法首次解决了使用HTTP/3传输的加密视频在大规模指纹库场景中的识别问题,具有很强的实用性和通用性.

    HTTP/3协议QUIC协议基于HTTP的动态自适应流媒体视频识别加密流量