首页期刊导航|计算机研究与发展
期刊信息/Journal information
计算机研究与发展
计算机研究与发展

徐志伟

月刊

1000-1239

crad@ict.ac.cn

010-62620696;62600350

100190

北京中关村科学院南路6号

计算机研究与发展/Journal Journal of Computer Research and DevelopmentCSCD北大核心CSTPCDEI
查看更多>>本刊是中国科学院计算技术研究所和中国计算机学会联合主办、科学出版社出版的学术性刊物、中国计算机学会会刊,我国第一个计算机刊物。主要刊登计算机科学技术领域高水平的学术论文、最新科研成果和重大应用成果。
正式出版
收录年代

    前言

    陶建华朱军侯臣平张利军...
    1573-1574页

    基于被动-主动的特征演化流学习

    刘艳芳李文斌高阳
    1575-1585页
    查看更多>>摘要:在许多现实应用中,数据以一种特征演化流的形式收集.例如,随着传感器的更换,由旧传感器收集的数据特征会消失,新传感器收集的数据特征会出现.在线被动-主动算法已被证明可以有效地从具有固定特征空间和梯形特征空间的数据集中学习线性分类器.因此,提出了一种基于被动-主动更新策略的特征演化学习算法(passive-aggressive learning with feature evolvable streams,PAFE).该算法通过主动-被动更新策略从当前特征空间和被恢复的已消失特征空间中学习了2个模型.具体来说,在重叠时段,即新旧特征同时存在的时段,该算法用新特征恢复了消失的特征空间,同时用旧特征空间模拟了新特征空间,进而为新特征空间的模型学习提供合理的初始化.基于这2个模型,为提高算法整体性能提出了2个集成算法:组合预测和当前最优预测.在合成数据集和真实数据集上的实验结果验证了该算法的有效性.

    在线学习被动-主动策略监督学习集成学习演化特征

    用于求解旅行商问题的深度智慧型蚁群优化算法

    王原陈名邢立宁吴亚辉...
    1586-1598页
    查看更多>>摘要:启发式算法是求解组合优化问题求解的重要手段,其主要特征是能够以可接受的计算代价找到足够好的可行解.然而,设计良好的用于求解组合优化问题的启发式算法需要大量的专业领域知识以及大量的试错工作,且人工设计的启发式算法不能够保证在不同问题集上均具有一致性表现.另一方面,深度学习方法能够通过学习自动设计启发式规则,然而深度学习方法通常缺少在解空间内搜索的能力.为克服以上问题,提出了一种基于蚁群优化和深度强化学习的混合启发式算法框架.在该框架中,蚁群算法能够利用深度强化学习提取的启发式信息,而深度强化学习方法的解空间搜索性能也由于蚁群算法的加入而获得提高.采用经典的TSPLIB中的算例对该算法求解旅行商问题的效能进行了计算验证,结果表明采用深度学习方法能够极大地提升蚁群算法的计算表现,并降低其计算代价.

    深度强化学习蚁群优化算法端到端学习混合元启发式算法旅行商问题

    基于张量分解的知识超图链接预测模型

    王培妍段磊郭正山蒋为鹏...
    1599-1611页
    查看更多>>摘要:知识超图包含了现实世界中的事实,并给出这些事实的结构化表示.但知识超图无法包括所有事实,所以其是高度不完整的.链接预测方法致力于根据现有实体间链接推理缺失链接,因此广泛应用于知识库补全.目前大多数研究集中于二元关系知识图谱的补全.然而,现实世界中实体间的关系通常是非二元的,即关系中涉及的实体通常多于2个.相较于知识图谱,知识超图能够以一种灵活且自然的方式来表示这些复杂的多元关系.对此,设计一个基于张量分解的知识超图链接预测模型Typer,显式地为不同关系以及不同位置上实体的角色建模,并对关系进行细化分解以提升模型性能.同时,考虑到促进实体与关系间的信息流动有助于学习实体和关系的嵌入表示,提出窗口的概念,以增加实体与关系的交互.此外,证明了Typer模型具有完全表达性,并给出了使模型具有完全表达性的嵌入表示维度边界.在多个公开真实知识超图数据集上进行了详实的实验,实验表明Typer模型能有效解决知识超图链接预测问题,并在所有数据集上取得了较其他方法更好的结果.

    知识超图链接预测知识库补全多元关系张量分解嵌入学习

    基于K阶互信息估计的位置感知网络表征学习

    储晓恺范鑫鑫毕经平
    1612-1623页
    查看更多>>摘要:随着网络结构数据持续、快速的增长,各种复杂网络数据分析与应用层出不穷.近年来,网络表征学习已经成为各类网络分析任务的主流方法.网络表征学习的主要目标是依据节点间连接关系,学习高质量的节点表征向量,从而辅助分析下游任务.然而,现有的表征学习方法未考虑节点在网络中的位置信息.为了解决这一问题,提出了一种位置感知网络表征学习模型PMI,该模型通过最大化每个中心节点与各阶邻居之间的互信息,从而将节点的位置信息学入表征向量中.在表征训练过程中,PMI模型激励每个中心节点记住并识别其每阶的邻居节点,从而间接记录其位置信息.在4个不同领域的真实数据集上进行了多标签分类、网络重构、链接预测等多个代表性网络分析任务实验,实验结果表明提出的PMI模型可以学到高质量的节点表征向量,与现有的表征学习模型相比,PMI模型能够在多个下游任务上有较大幅度提升.此外,还设计邻居对齐任务对PMI模型进行进一步的分析,结果表明PMI模型学到的节点表征能够有效识别不同阶的邻居节点并捕获自身的位置信息,从而为各种下游任务生成合理有效的表征.

    网络表征学习互信息估计节点表征信息网络分析神经网络节点分类链接预测

    基于非递减时序随机游走的动态异质网络嵌入

    郭佳雯白淇介林铸天宋春瑶...
    1624-1641页
    查看更多>>摘要:网络嵌入是将高维网络映射到低维向量空间的一种表示学习方法.目前,人们对动态同质网络嵌入和静态异质信息网络嵌入已经开展了一些研究,但动态异质网络上的嵌入研究仍然较少,如果直接应用静态网络嵌入或动态同质网络嵌入方法来解决动态异质网络嵌入问题,会由于忽略网络的动态或异质特性而导致严重的信息丢失.因此,提出一种基于时间和类别约束随机游走的动态异质网络嵌入方法TNDE.该方法引入类别约束,能够解决动态异质网络中由于异质特性带来的语义信息保留问题.不同于其他动态网络中的时序随机游走,该方法采用非递减的时间约束来增量式地进行随机游走,能够解决网络同时具备动态和异质特性而引入的强语义局部结构上的边时间戳一致的挑战,避免游走时出现时间戳陷入的问题.通过对实时变化的增量游走和嵌入学习,TNDE提供了一种高效的在线表示学习算法.在3个真实数据集上的实验结果表明:该方法在不同特性的网络中具有良好的通用性.与目前最先进方法相比,能够得到下游链路预测和节点分类任务中2.4%~92.7%的准确度提升,显著提高了嵌入质量,并在保证良好嵌入质量的前提下,缩短算法运行时间12.5 %~99.91%.

    动态网络异质信息网络网络嵌入增量学习随机游走

    基于病毒传播网络的基因序列表示学习

    马扬刘泽一梁星星程光权...
    1642-1654页
    查看更多>>摘要:基因序列数据中往往存在大量的非编码和缺失序列,现有的基因序列表示大多通过人工方法对高维的基因序列进行特征提取,不仅非常耗时且成功的预测很大程度依赖于生物学知识的正确利用.基于病毒传播网络构建了一种基于图上下文信息的基因序列表示方法,对目标节点病毒序列进行编码后,使用注意力机制对其邻居节点的序列信息进行聚合,从而得到目标节点病毒序列的新的低维表示.进而依据病毒传播网络中相邻节点的基因序列相似性高于不相邻节点的特征,对基因序列表示模型进行优化,训练后得到的新的表示不仅可以有效表达基因序列的特征,同时极大地降低了序列的维度,提高了计算效率.分别在仿真病毒传播网络、新型冠状病毒和艾滋病毒传播网络数据上训练基因序列表示模型,并在相应的网络上进行未采样感染者发现任务.实验结果充分验证了模型的有效性,与其他方法的比较证明了模型的高效性,模型可以有效地在病毒传播网络上发现未采样感染者,这在流行病调查领域也具有一定的实际意义.

    复杂网络基因表示机器学习图神经网络病毒传播

    基于多模态对抗学习的无监督时间序列异常检测

    黄训华张凤斌樊好义席亮...
    1655-1667页
    查看更多>>摘要:时间序列异常检测旨在发现对应时序特征中不符合一般规律的特异性模式,是机器学习领域重要的研究方向之一.然而,现有的时序异常检测方法大多为单模态学习,忽略了时序信息在多模态空间上不同特征分布的关联性和互补性,不能充分利用已有信息进行有效地模式挖掘,从而造成检测效果差等问题.为此,提出了一种基于多模态对抗学习的无监督时间序列异常检测模型.首先,将原始时间序列转换至频域空间,构造多模态时间序列表示.其次,提出多模态生成对抗网络模型,针对多模态时间序列,实现正常时序信息关于时域和频域特征分布的无监督联合学习.最后,通过将异常检测问题转化为时间序列在时域和频域空间的重构度量问题,从时域空间和频域空间2个方面度量时间序列的异常值,实现更有效的异常检测.在时间序列数据集合UCR和MIT-BIH中的6个真实数据集的实验结果表明,在异常检测任务上相较于传统单模态异常检测方法,提出方法在AUC和AP这2个性能指标上最高分别提升了12.50%和21.59%,证明了方法的有效性.

    时间序列无监督异常检测特征分布对抗学习多模态

    基于代码属性图和Bi-GRU的软件脆弱性检测方法

    肖添明管剑波蹇松雷任怡...
    1668-1685页
    查看更多>>摘要:现在软件规模越来越庞大和复杂,脆弱性形式也更趋向多样化,传统的脆弱性检测方法存在人工参与度高、对未知脆弱性检测能力弱的缺点,已无法满足对多样化脆弱性的检测要求.为了提高对未知脆弱性的检测效果,大量机器学习方法被应用到软件脆弱性检测领域.由于现有方法在代码表征过程中存在着较高的语法和语义信息的损失,导致误报率和漏报率较高.针对这一问题,提出了一种基于代码属性图和Bi-GRU的软件脆弱性检测方法.该方法通过从函数的代码属性图中提取出抽象语法树序列、控制流图序列作为函数表征的表征方式,减少代码表征过程中的信息的损失,并通过选取Bi-GRU来构建特征提取模型,提高对脆弱性代码的特征提取能力.实验结果表明,与以抽象语法树为表征方式的方法相比,该方法最大可提高35%的精确率和22%的召回率,可改善面向多个软件源代码混合的真实数据集的脆弱性检测效果,有效降低误报率和漏报率.

    脆弱性检测代码属性图代码表征机器学习Bi-GRU

    基于改进RetinaNet的自然环境中蝴蝶种类识别

    谢娟英鲁银圆孔维轩许升全...
    1686-1704页
    查看更多>>摘要:蝴蝶是一种对栖息地敏感的昆虫,自然环境中的蝴蝶种类分布反映了区域生态系统平衡和生物多样性.专家鉴别蝴蝶种类耗时耗力,计算机视觉技术为野外环境中蝴蝶种类自动识别提供了可能.针对野外环境下的蝴蝶图像特征,提出2种新的硬注意力机制,DSEA (direct squeeze-and-excitation with global average pooling)和DSEM(direct squeeze-and-excitation with global max pooling),改进经典目标检测算法RetinaNet,并引入可变形卷积增强RetinaNet对蝴蝶形变的建模能力,实现野外环境下蝴蝶种类自动识别.以mAP (mean average precision)目标检测指标评价模型性能,通过实验结果可视化,分析影响模型性能的关键因素.实验结果显示,提出的改进RetinaNet对自然环境下的蝴蝶识别任务具有很不错的效果,特别是基于DSEM的RetinaNet;分布平衡的训练集可以提升提出模型的泛化性能;样本的结构相异性是影响模型性能的关键因素.

    蝴蝶检测蝴蝶识别注意力机制可变形卷积RetinaNet