首页期刊导航|计算机研究与发展
期刊信息/Journal information
计算机研究与发展
计算机研究与发展

徐志伟

月刊

1000-1239

crad@ict.ac.cn

010-62620696;62600350

100190

北京中关村科学院南路6号

计算机研究与发展/Journal Journal of Computer Research and DevelopmentCSCD北大核心CSTPCDEI
查看更多>>本刊是中国科学院计算技术研究所和中国计算机学会联合主办、科学出版社出版的学术性刊物、中国计算机学会会刊,我国第一个计算机刊物。主要刊登计算机科学技术领域高水平的学术论文、最新科研成果和重大应用成果。
正式出版
收录年代

    面向回归任务的数值型标签噪声过滤算法

    姜高霞王文剑
    1637-1652页
    查看更多>>摘要:回归任务中的数值型标签噪声可能误导模型训练,进而弱化模型泛化能力.作为一种常用的标签噪声处理技术,噪声过滤通过去除误标记样本来降低噪声水平,但无法保证过滤后模型能够获得更好的泛化表现.一些过滤算法过于关注噪声水平,以至于大量无噪样本也被去除.尽管已有样本过滤框架能够平衡样本去除量和噪声水平,但其形式过于复杂不利于直观理解和实际应用.根据无噪回归任务中的学习理论提出了面向数值型标签噪声数据的泛化误差界,从而明确了影响模型泛化能力的关键数据因素(数据量和噪声水平).在此基础上提出一种可解释的噪声过滤框架,其目标是以较小的样本去除代价最大程度地降低噪声水平.针对噪声估计问题,从理论上分析了噪声与覆盖区间关键指标(中心和半径)之间的变化趋势,进而构建了相对噪声估计方法.此方法与所提框架结合形成了相对噪声过滤(relative noise filtering,RNF)算法.在标准数据集和年龄估计数据上均验证了算法的有效性.实验结果表明:该算法能够适应各类噪声数据,显著提升模型泛化能力.在年龄估计数据上RNF算法检测出一些标签噪声数据,有效提升了数据质量和模型预测性能.

    数值型标签噪声回归噪声过滤泛化误差界相对噪声

    多粒度融合驱动的超多视图分类方法

    梁新彦钱宇华郭倩黄琴...
    1653-1667页
    查看更多>>摘要:有效的融合算子可提升多视图分类方法的性能.随着视图个数增多,现有融合算子面临2方面挑战:1)表达能力强的融合算子得到的融合向量维度呈指数增加,而融合维度不变的融合算子的表达能力较弱;2)现有融合算子往往一次作用于全部视图,这种融合策略建模视图间的关系较为困难.为解决这些问题,受多粒度启发,提出一种多粒度融合的超多视图分类方法.首先,使用1个融合算子建模任意视图对之间的关系;然后,基于成对关系结果,使用1个融合算子建模每个视图与其他全部视图的关系;最后,基于每个视图与其他全部视图的关系结果,使用1个融合算子建模全部视图间的关系.4个大规模数据集上的实验结果表明:多粒度融合的超多视图分类方法的性能统计上优于比较方法,这表明多粒度由易到难建模视图特征间关系的策略确实可提升多视图分类方法的性能.

    超多视图融合分类多粒度多层次

    面向特征继承性增减的在线分类算法

    刘兆清古仕林侯臣平
    1668-1682页
    查看更多>>摘要:近年来,在线学习由于其巨大的实际应用价值,已经得到人们广泛的研究.然而,在许多开放环境应用场景下,当前时刻数据可能会增加新的特征,而下一时刻只有部分原有特征得以继承.例如,在环境监测中,新的传感器部署会产生数据新特征;下一时刻部分旧的传感器失效,部分原有特征被保留.这样的数据被称为特征继承性增减的流式数据.传统的在线学习算法大多建立在数据特征空间稳定不变的基础之上,无法直接处理此种情形.针对上述问题,提出了 一种面向特征继承性增减的在线分类算法(online classification algorithm with feature inheritably increasing and decreasing,OFID)及其 2 种变体.当新特征出现时,通过结合在线被动-主动方法与结构风险最小化原则分别更新原始特征与新增特征上的分类器;当旧特征消失时,对数据流使用Frequent-Directions算法进行补全,使得旧分类器得以继续更新迭代.从理论上证明了 OFID系列算法的损失上界,同时通过大量的实验验证了所提算法的有效性.

    动态特征空间继承性增减的特征矩阵补全在线学习二分类

    基于元图卷积的异质网络嵌入学习算法

    任嘉睿张海燕朱梦涵马波...
    1683-1693页
    查看更多>>摘要:异质网络嵌入是将异质网络中丰富的结构和语义信息嵌入到低维的节点表示中.图卷积网络是处理网络数据的一种有效方法,当前也被用于研究异质网络的多类型节点和多维关系的表示问题,现有的图卷积网络模型主要采用元路径来表示不同类型节点间的一种语义关系.然而,孤立的单条元路径无法准确地反映节点间的复杂语义,即不能充分利用节点间存在的多种高阶间接语义关系.针对上述问题,提出了一种基于元图卷积的异质网络嵌入学习算法MGCN(meta-graph convolutional network),包括基于元图的异构邻接矩阵计算以及学习节点的嵌入表示2个阶段,基于元图的异构邻接矩阵设计了融合多条元路径上的不同语义的计算方法,能够挖掘节点间的高阶间接关系,通过异构邻接矩阵的计算,能够聚合节点邻域特征为统一模式,此种卷积学习降低了图卷积方法的嵌入维数,从而减少了计算时间.在2个公开的异质网络数据集上进行社会计算基础研究任务的实验表明,MGCN在节点分类、聚类任务上比基线模型有更好的性能且需更少的训练时间.

    异质网络嵌入图卷积神经网络元图异构邻接矩阵高阶间接关系

    基于强化学习的知识图谱综述

    马昂于艳华杨胜利石川...
    1694-1722页
    查看更多>>摘要:知识图谱是一种用图结构建模事物及事物间联系的数据表示形式,是实现认知智能的重要基础,得到了学术界和工业界的广泛关注.知识图谱的研究内容主要包括知识表示、知识抽取、知识融合、知识推理4部分.目前,知识图谱的研究还存在一些挑战.例如,知识抽取面临标注数据获取困难而远程监督训练样本存在噪声问题,知识推理的可解释性和可信赖性有待进一步提升,知识表示方法依赖人工定义的规则或先验知识,知识融合方法未能充分建模实体之间的相互依赖关系等问题.由环境驱动的强化学习算法适用于贯序决策问题.通过将知识图谱的研究问题建模成路径(序列)问题,应用强化学习方法,可解决知识图谱中的存在的上述相关问题,具有重要应用价值.首先梳理了知识图谱和强化学习的基础知识.其次,对基于强化学习的知识图谱相关研究进行全面综述.再次,介绍基于强化学习的知识图谱方法如何应用于智能推荐、对话系统、游戏攻略、生物医药、金融、安全等实际领域.最后,对知识图谱与强化学习相结合的未来发展方向进行展望.

    知识图谱强化学习命名实体识别关系抽取知识推理知识表示知识融合

    面向增量分类的多示例学习

    魏秀参徐书林安鹏杨健...
    1723-1731页
    查看更多>>摘要:近年来多示例学习(multi-instance learning,MIL)被广泛应用于复杂数据问题中,但现有的多示例学习算法往往在封闭静态环境中工作良好,其所处理的类别数量也恒定不变.然而在现实应用当中,常会有新的类别不断地加入到系统当中,例如科学的发展中不断出现新的议题、社交媒体中不断出现新的话题.由于存储限制或保密协议等原因,旧数据可能随着时间的发展变得不可见,这使得直接学习新的类别时模型会忘记曾经学过的知识.增量学习则被用于解决上述问题.因此,在多示例学习设定下进行增量数据挖掘十分有意义,然而目前针对多示例学习下的增量数据挖掘的工作十分稀少.提出一个基于注意力机制和原型分类器映射的多示例增量数据挖掘方法,通过注意力机制选择性地将多示例包的示例汇合为统一的特征表示,然后为每个类别生成类别原型表示并存储下来.类别原型通过原型分类器映射模块得到无偏鲁棒的类别分类器,并通过上一个增量阶段生成的分类器的预测结果对新增量阶段生成的分类器的预测结果进行知识蒸馏,使得模型能够在多示例学习下以极低的存储很好地保留模型的旧知识.实验结果表明:提出的方法能够有效地进行面向增量分类的多示例学习.

    多示例学习增量学习注意力机制知识蒸馏原型

    点云配准中多维度信息融合的特征挖掘方法

    武越苑咏哲岳铭煜公茂果...
    1732-1741页
    查看更多>>摘要:数据挖掘是使用人工智能等方法在大型数据集中提取隐含潜在信息的过程,为从大量信息中获取有价值的知识提供了有效途径.在使用深度学习解决点云配准任务的过程中,数据挖掘也无处不在.全局特征提取和刚体变换估计是无对应点云配准的2个关键阶段,挖掘隐藏在2个阶段中的丰富信息是点云配准的重要任务之一.然而,最近提出的方法在提取全局特征时容易忽略低维局部特征,导致大量点云信息的丢失,使得后续刚体变换估计阶段求解变换参数时精度无法达到预期.首先,提出了一种基于多维度信息融合的特征挖掘网络,充分挖掘点云中的高维全局和低维局部信息,有效弥补了点云配准的全局特征提取阶段局部特征的缺失.其次,在刚体变换估计阶段使用了对偶四元数估计姿态,其可以在一个公共框架内同时表示旋转和平移,为姿态估计提供紧凑和精确的表示.最后,在ModelNet40数据集上进行的大量实验表明:与现有前沿的无对应点云配准方法相比,提出的方法可以获得更高的精度,同时对噪声具有较强的鲁棒性.

    数据挖掘特征提取点云配准多维度信息融合对偶四元数

    面向知识超图链接预测的生成对抗负采样方法

    郭正山左劼段磊李仁昊...
    1742-1756页
    查看更多>>摘要:知识超图作为知识图谱的拓展,对多元关系事实具有良好表达能力.利用知识超图对现实世界中已知事实进行建模,并通过链接预测发现未知事实成为当前研究热点.在现有知识超图(知识图谱)链接预测方法中,构建样本真实标签与预测标签间的损失函数是关键步骤,其中负样本对链接预测模型的训练具有极大的影响.将知识图谱链接预测的负采样方法(如均匀随机负采样)用于知识超图链接预测会面临负样本质量低下、复杂度过高等问题.对此,设计了面向知识超图链接预测的生成对抗负采样方法HyperGAN,通过对抗训练生成高质量负样本以解决"零损失"问题,从而提升链接预测模型的准确度.HyperGAN方法无需预训练,因此在辅助链接预测模型进行训练时相比现有负采样方法具有更高的效率.在多个真实数据集上的对比实验表明:HyperGAN在性能与效率方面均优于基线方法.此外,具体案例分析及定量分析亦验证了 HyperGAN方法在提升负样本质量方面的有效性.

    知识超图链接预测生成对抗网络负采样多元关系

    基于时空Transformer的社交网络信息传播预测

    范伟刘勇
    1757-1769页
    查看更多>>摘要:随着社交网络的日益普及和广泛应用,信息传播预测逐渐成为了社交网络分析领域的一个热点研究问题.之前大部分研究要么只利用信息传播序列,要么只利用用户之间的社交网络来进行预测,难以对信息传播过程的复杂性进行有效建模.此外,常用于信息传播预测的循环神经网络(recurrent neural network,RNN)及其变体难以有效捕获信息之间的相关性.为解决上述问题,提出了一个新的基于时空Transformer的社交网络信息传播预测模型STT.该模型首先构建由社交网络图和动态传播图组成的异构图并使用图卷积网络(graph convolutional network,GCN)来学习用户的结构特征;然后将用户的时序特征和结构特征放入到Transformer中进行融合来获取时空特征;为有效融合用户的时序特征和结构特征,提出了一种新的残差融合方式来替代Transformer中原有的残差连接;最后利用Transformer来进行信息传播预测.真实数据集上的大量实验验证了模型STT的有效性.

    社交网络信息传播预测Transformer图卷积网络时空特征

    基于校园上网行为感知的学生成绩预测方法

    姚丽崔超然马乐乐王飞超...
    1770-1781页
    查看更多>>摘要:学生成绩预测旨在利用学生的相关信息预测其在未来的学业表现.随着校园信息化建设的持续推进,校园网络认证系统越来越完善,各高校逐步积累了丰富的学生校园上网行为数据.考虑到人的行为表现和学习能力密切相关,以校园上网行为感知为切入点,通过挖掘学生的上网行为日志来预测他们的成绩.为此,收集构建了一个同时包含学生校园上网行为和成绩数据的真实数据集,并通过数据分析证明两者之间确实存在一定的关联性.在此基础上,提出了一个端到端的双层自注意力网络(dual-level self-attention network,DEAN),引入级联式的自注意力机制来分别提取学生每一天的局部上网行为特征和长时间的全局上网行为特征,更好地解决了长行为序列建模问题.此外,通过多任务学习策略在统一的框架下同时解决面向不同专业的学生成绩预测问题,并设计了基于学生排名差的代价敏感损失来进一步提升方法的性能.实验结果表明:相比于传统的序列建模方法,所提出的方法具有更好的预测精度.

    学生成绩预测校园上网行为感知双层自注意力网络多任务学习代价敏感学习