首页期刊导航|计算机研究与发展
期刊信息/Journal information
计算机研究与发展
计算机研究与发展

徐志伟

月刊

1000-1239

crad@ict.ac.cn

010-62620696;62600350

100190

北京中关村科学院南路6号

计算机研究与发展/Journal Journal of Computer Research and DevelopmentCSCD北大核心CSTPCDEI
查看更多>>本刊是中国科学院计算技术研究所和中国计算机学会联合主办、科学出版社出版的学术性刊物、中国计算机学会会刊,我国第一个计算机刊物。主要刊登计算机科学技术领域高水平的学术论文、最新科研成果和重大应用成果。
正式出版
收录年代

    HSEGRL:一种分层可自解释的图表示学习模型

    李平宋舒寒张园曹华伟...
    1993-2007页
    查看更多>>摘要:近年来,随着图神经网络(graph neural network,GNN)技术在社交、信息、化学、生物等领域的广泛应用,GNN可解释性也受到广泛的关注.然而,现有的解释方法无法捕获层次化的解释信息,同时,这些层次信息未能被充分利用以提升图分类任务的准确率.基于这一问题,提出了一种层次化自解释的图表示学习(hierarchical self-explanation graph representation learning,HSEGRL)模型,该模型通过发现图结构中的层次信息进行图分类预测的同时,输出层次化的模型自解释结果.具体而言,针对图层次信息的发现设计了提取信息的基本单元——解释子,该解释子由提取节点特征的编码器获取层次化解释感知子图的池化层和抽取高阶解释信息的解码器组成.其中,为了准确提取层次化的解释子图,针对该模型的池化操作进行了解释感知优化设计,该设计通过评估模型的拓扑及特征重要性,层次化地筛选解释子图,实现分层自解释的同时完成图分类任务.HSEGRL是一个功能完备且便于迁移的图表示学习自解释模型,可以层次化综合考虑模型的拓扑信息与节点特征信息.在模型有效性验证层面,分别在分子、蛋白质和社交数据集上进行大量实验,实验结果表明所提模型在图分类任务中的分类准确率高于已有的先进的GNN自解释模型和GNN模型,并通过可视化分层解释结果的信息证明了该解释方法可信.

    图表示学习图神经网络可自解释模型图拓扑消息传递机制

    基于元素分离与整体注意力的图卷积网络框架

    祝传振王璇郑强
    2008-2019页
    查看更多>>摘要:目前,图卷积网络在处理图数据等非结构化数据方面具有很大的潜力,然而在处理稠密连接图时仍面临一定的挑战,因为其基于节点的邻域信息聚合机制容易导致整个网络图出现过度平滑现象从而弱化网络图的表达能力.稀疏图的构建在一定程度上能够缓解网络图在卷积过程中的过度平滑现象,但是稀疏图容易丢失信息且稀疏化的过程缺乏统一标准,从而影响模型的一致性和可解释性.为此,提出了一种基于元素分离与整体注意力的图卷积网络框架(EH-GCN).该框架无需建立在稀疏图的基础之上,不仅能够在稠密连接图分别学习图的连接特征和节点特征,而且采用全局注意力机制进行连接特征和节点特征的整合,从而克服了传统图卷积网络框架在应对稠密连接图时的局限性,提高了网络图的特征表达能力.首先在ADNI,ABIDE和AIBL这 3个脑影像数据集上构建全连接脑网络,验证了EH-GCN在稠密连接图分类任务中的有效性.随后,所提模型在FRANKENSTEIN化学分子图数据集上进行了测试,证明了其强大的泛化能力.此外,所提模型的可解释性分析结果与先前的神经病理学研究一致,进一步证明了所提模型的生物学基础.

    图卷积网络脑网络图分类阿尔茨海默症自闭症谱系障碍

    基于图提示微调的交通流量预测

    赖培源李程王增辉王昌栋...
    2020-2029页
    查看更多>>摘要:交通流量预测是建设智慧城市重要的基础功能,对城市的交通管理和用户出行规划具有重要意义.由于时间维度和空间维度的扩展,交通流量的数据具有规模大、增长快速、实时更新等特征,传统的训练模型通常需要将大量的历史数据进行训练预测,导致较长的计算时间和较高的算力成本,因此,如何使用低计算成本的预测模型来满足广泛的流量预测需求是重要的技术挑战.近年来兴起的提示微调范式在自然语言处理的下游任务推广中取得了较好的效果,受其启发,提出利用少量的实时数据来微调优化大规模历史数据预训练的模型,为交通流量模型预测的优化应用提出了一种新的思路.通过引入图提示微调的交通流量预测(traffic flow prediction based on graph prompt-finetuning,TPGPF)模型的泛化能力,在时空多维度下的交通流量图预测模型中,基于历史数据集进行预测模型的预训练,并引入可学习的提示向量,在预训练模型固化的情况下指导预训练的自监督学习模型,以适应新的数据预测任务,提升交通流量预测模型的通用性和有效性.通过在5个公开数据集上进行了大量的实验,证明了TPGPF的有效性.

    图提示交通流量预测微调预训练模型自监督学习

    基于规则提示的知识图谱通用推理预训练模型

    崔员宁孙泽群胡伟
    2030-2044页
    查看更多>>摘要:知识图谱是存储真实世界海量知识的图数据库,为大量知识驱动的下游任务提供了数据支持.知识图谱往往具有不完备性,存在大量缺失的事实,因此知识图谱推理任务基于已知事实推理新结论来补全知识图谱.随着知识工程及其商业应用的研究与发展,大量通用和领域知识图谱被构建.现有知识图谱推理方法大多面向单一知识图谱的补全,不具备通用推理能力.近年来,受预训练大语言模型通用能力的启发,一些通用的知识图谱推理预训练模型被提出.针对现有预训练模型无法识别高质量推理模式的问题,提出一个基于规则提示的知识图谱通用推理预训练模型——RulePreM,该模型筛选与利用高质量推理规则来提高知识图谱上的推理能力.首先基于推理规则构建关系IO图和一个编码器RuleGNN对关系进行编码,然后将关系编码作为提示来编码知识图谱中的实体,最后对候选实体进行打分预测.还提出一种结合规则置信度的注意力机制,来进一步减少低质量推理模式的影响.实验结果表明,所提出的模型在43个不同设定下的知识图谱上具有良好的通用推理能力,平均性能指标均优于现有的有监督模型和预训练模型.

    知识图谱规则通用推理预训练提示学习关系IO图

    图神经常微分方程综述

    焦鹏飞陈舒欣郭翾何东晓...
    2045-2066页
    查看更多>>摘要:图神经网络(graph neural network,GNN)是处理图结构数据的强大工具,能够捕捉节点间的复杂关系和特征.但GNN的离散架构导致其在表示图结构、建模图演化、适应不规则数据和计算开销等方面面临诸多挑战.面对这些挑战,神经常微分方程(ordinary differential equation,ODE)由于能够模拟系统状态的连续变化,具备"连续深度"的编码和推断能力,被作为解决GNN面临挑战的全新方法而引入.然而,神经ODE是为欧式结构数据设计的,无法直接捕捉图结构特性.因此,提出了图神经ODE,一种将神经ODE与GNN结合的新架构,可以更好地适应图结构数据并充分利用其特性.近年来,图神经ODE相关研究已经深入到图机器学习的各个方向中,引发了新的研究热潮.在此背景下,适时地对图神经ODE研究前沿进行了系统性综述.首先,回顾了GNN的关键优势和面临的诸多挑战,阐述了引入神经ODE并与GNN结合的理论基础和实践意义.随后,详细介绍了图神经ODE的背景和基本概念,并提出了一种新颖的分类方法,在此基础上对当前的相关方法进行了全面描述.然后,介绍了相关研究常用的验证方法,包括下游任务及数据集.进一步,深入探讨了图神经ODE在多个实用领域上的应用.最后,对图神经ODE面临的挑战和未来发展趋势进行了总结和展望.

    图机器学习图神经网络神经常微分方程分类体系综述

    图终身学习:综述

    刘壮董子宸董宜琳尚家名...
    2067-2096页
    查看更多>>摘要:图终身学习(lifelong graph learning,LGL)是一个新兴领域,旨在实现对图结构数据的持续学习,以解决现有任务上的灾难性遗忘问题,并使得顺序更新的模型能够适应新出现的图任务.尽管LGL展现出良好的学习能力,但如何持续提高其性能仍然是一个至关重要的问题.为填补现有研究对这一方面的空白,对最近在LGL领域的研究进行了全面调查和总结.首先,重新分类了LGL的现有方法,重点关注克服灾难性遗忘的方法.随后,系统地分析了这些方法的优缺点,并探讨了实现持续性能提升的潜在解决方案.该研究着重于如何在持续学习的过程中避免对旧任务的遗忘,同时快速适应新任务的挑战.最后,还就LGL的未来发展方向进行了讨论,涵盖了其在应用领域、开放性问题等方面的潜在影响,并具体分析了这些方向对持续性能改进的潜在影响.这些讨论将有助于指导未来LGL研究的方向,推动这一领域的进一步发展与应用.

    图终身学习(LGL)图神经网络(GNN)重放正则化持续学习增量学习灾难性遗忘

    面向SIMD指令集的SM4算法比特切片优化

    王闯丁滟黄辰林宋连涛...
    2097-2109页
    查看更多>>摘要:SM4算法是中国自主设计的商用分组密码算法,其加解密计算性能成为影响信息系统数据机密性保障的重要因素之一.现有SM4算法优化主要面向硬件设计和软件查表等方向展开研究,分别存在依赖特定硬件环境、效率低下且易遭受侧信道攻击等问题.比特切片技术通过对输入数据重组实现了并行化高效分组密码处理,可以抵御针对缓存的侧信道攻击.然而现有切片分组密码研究对硬件平台相关性强、处理器架构支持单一,并且并行化处理流水启动较慢,面向小规模数据的加解密操作难以充分发挥单指令多数据(single instruction multiple data,SIMD)等先进指令集的优势.针对上述问题,首先提出了一种跨平台的通用切片分组密码算法模型,支持面向不同的处理器指令字长提供一致化的通用数据切片方法.在此基础上,提出了一种面向SIMD指令集的细粒度切片并行处理SM4优化算法,通过细粒度明文切片重组与线性处理优化有效缩短算法启动时间.实验结果表明,相比通用SM4算法,优化的SM4比特切片算法加密速率最高可达 438.0 MBps,加密每字节所需的时钟周期最快高达 7.0 CPB(cycle/B),加密性能平均提升80.4%~430.3%.

    SM4算法性能优化比特切片侧信道攻击SIMD指令集

    一种面向联盟链Hyperledger Fabric的并发冲突事务优化方法

    吴海博刘辉孙毅李俊...
    2110-2126页
    查看更多>>摘要:随着区块链技术应用的普及,联盟链Hyperledger Fabric(简称Fabric)已成为知名区块链开源平台,并得到广泛关注.然而Fabric仍受困于并发事务间冲突问题,冲突发生时会引发大量无效交易上链,导致吞吐量下降,阻碍其发展.对于该问题,现有面向块内冲突的方案缺乏高效的冲突检测和避免方法,同时现有研究往往忽略区块间冲突对吞吐量的不利影响.提出了一种Fabric的优化方案Fabric-HT(fabric with high throughput),从区块内和区块间 2方面入手,有效降低事务间并发冲突和提高系统吞吐量.针对区块内事务冲突,提出了一种事务调度机制,根据块内冲突事务集定义了一种高效数据结构——依赖关系链,识别具有"危险结构"的事务并提前中止,合理调度事务和消除冲突;针对区块间事务冲突,将冲突事务检测提前至排序节点完成,建立以"推送-匹配"为核心的冲突事务早期避免机制.在多场景下开展大量实验,结果表明Fabric-HT在吞吐量、事务中止率、事务平均执行时间、无效事务空间占用率等方面均优于对比方案.Fabric-HT吞吐量最高可达Fabric的 9.51倍,是最新优化方案FabricSharp的 1.18倍;空间利用率上相比FabricSharp提升了14%.此外,Fabric-HT也表现出较好的鲁棒性和抗攻击能力.

    并发冲突区块链HyperledgerFabric事务调度冲突检测