首页期刊导航|计算机研究与发展
期刊信息/Journal information
计算机研究与发展
计算机研究与发展

徐志伟

月刊

1000-1239

crad@ict.ac.cn

010-62620696;62600350

100190

北京中关村科学院南路6号

计算机研究与发展/Journal Journal of Computer Research and DevelopmentCSCD北大核心CSTPCDEI
查看更多>>本刊是中国科学院计算技术研究所和中国计算机学会联合主办、科学出版社出版的学术性刊物、中国计算机学会会刊,我国第一个计算机刊物。主要刊登计算机科学技术领域高水平的学术论文、最新科研成果和重大应用成果。
正式出版
收录年代

    一种基于安全多方计算的快速Transformer安全推理方案

    刘伟欣管晔玮霍嘉荣丁元朝...
    1218-1229页
    查看更多>>摘要:Transformer模型在自然语言处理、计算机视觉等众多领域得到了广泛应用,并且有着突出的表现.在Transformer的推理应用中用户的数据会被泄露给模型提供方.随着数据隐私问题愈发得到公众的关注,上述数据泄露问题引发了学者们对Transformer安全推理的研究,使用安全多方计算(secure multi-party computation,MPC)实现Transformer模型的安全推理是当前的一个研究热点.由于Transformer模型中存在大量非线性函数,因此使用MPC技术实现Transformer安全推理会造成巨大的计算和通信开销.针对Transformer安全推理过程中开销较大的Softmax注意力机制,提出了 2种MPC友好的注意力机制Softmax freeDiv Attention 和 2Quad freeDiv Attention.通过将 Transformer 模型中的 Softmax 注意力机制替换为新的MPC友好的注意力机制,同时结合激活函数GeLU的替换以及知识蒸馏技术,提出了一个MPC友好的Transformer转换框架,通过将Transformer模型 转化为MPC友好的Transformer模型,提高Transformer安全推理的效率.在局域网环境下使用安全处理器(secure processing unit,SPU)提供的隐私计算协议,基于所提出的MPC友好的Transformer转换框架,在SST-2上使用Bert-Base进行安全推理.测试结果表明,在保持推理准确率与无近似模型一致的情况下,安全推理计算效率提高2.26倍.

    安全推理Transformer安全多方计算安全处理器知识蒸馏

    欺骗防御技术发展及其大语言模型应用探索

    王瑞阳长江邓向东刘园...
    1230-1249页
    查看更多>>摘要:欺骗防御作为主动防御中最具发展前景的技术,帮助防御者面对高隐蔽未知威胁化被动为主动,打破攻守间天然存在的不平衡局面.面对潜在的威胁场景,如何利用欺骗防御技术有效地帮助防御者做到预知威胁、感知威胁、诱捕威胁,均为 目前需要解决的关键问题.博弈理论与攻击图模型在主动防御策略制定、潜在风险分析等方面提供了有力支撑,总结回顾了近年来二者在欺骗防御中的相关工作.随着大模型技术的快速发展,大模型与网络安全领域的结合也愈加紧密,通过对传统欺骗防御技术的回顾,提出了一种基于大模型的智能化外网蜜点生成技术,实验分析验证了外网蜜点捕获网络威胁的有效性,与传统Web蜜罐相比较,在仿真性、稳定性与灵活性等方面均有所提升.为增强蜜点间协同合作、提升对攻击威胁的探查与感知能力,提出蜜阵的概念.针对如何利用蜜点和蜜阵技术,对构建集威胁预测、威胁感知和威胁诱捕为一体的主动防御机制进行了展望.

    欺骗防御大语言模型攻击图博弈论蜜点蜜阵

    基于大语言模型隐含语义增强的细粒度虚假新闻检测方法

    柯婧谢哲勇徐童陈宇豪...
    1250-1260页
    查看更多>>摘要:随着生成式人工智能技术的发展,许多领域都得到了帮助与发展,但与此同时虚假信息的构建与传播变得更加简单,虚假信息的检测也随之难度增加.先前的工作主要聚焦于语法问题、内容煽动性等方面的特点,利用深度学习模型对虚假新闻内容进行建模.这样的方式不仅缺乏对内容本身的判断,还无法回溯模型的判别原因.针对上述问题提出一种基于大语言模型隐含语义增强的细粒度虚假新闻检测方法.该方法充分挖掘并利用了现有的生成式大语言模型所具有的总结与推理能力,按照主干事件、细粒度次要事件和隐含信息推理的顺序进行层级式推导,逐步判别新闻的真实性.通过分解任务的方式,该方法最大程度发挥了模型的能力,提高了对虚假新闻的捕获能力,同时该方法也具有一定的可解释性,能够为检测提供判别依据.

    社交媒体虚假新闻检测大语言模型事件抽取知识增强

    2021至2023年人工智能领域研究热点分析述评与展望

    魏子舒韩越刘思浩张圣宇...
    1261-1275页
    查看更多>>摘要:在当今数字化和智能化的时代背景下,人工智能(artificial intelligence,AI)已成为科技创新的重要引擎,总结探讨AI研究的最新趋势和未来发展方向具有重要的研究和现实意义.为此,对2021-2023年间在中国计算机学会(CCF)推荐的AI领域CCF-A类国际会议和期刊所发表论文的研究成果进行收集,并在此基础上采用文献计量学的方法论来通过关键词对研究热点进行分析,进行基于高频关键词分析研究热点、基于新增关键词分析研究趋势、基于引用量加权的关键词分析高影响力研究,可以梳理AI研究的主流方向、发现AI主要研究方向的相互联系和交叉融合的特点.此外,对当前研究热点如大语言模型(large language model,LLM)、AI驱动的科学研究(AI for Science)和视觉生成相关论文的关联热点进行分析,可以挖掘技术路径和方法论的演变,展现技术创新背后的科学理论和应用前景,从而进一步揭示AI研究的最新趋势和发展前景.

    人工智能研究热点关键词统计分析数据挖掘

    基于集合效用边际贡献学习的可解释薪酬预测算法

    孙莹章玉婷庄福振祝恒书...
    1276-1289页
    查看更多>>摘要:知识技能对薪酬影响作用视为一种多变量影响下高维元素集合的效用建模问题.深度神经网络为解决复杂问题提供了新的机遇,但针对知识导向的细粒度薪酬预测问题,仍缺乏能够对复杂变量影响下的集合效用进行准确、可解释建模的神经网络结构.为此,提出一种基于边际贡献的增量式集合效用网络(marginal contribution-based incremental set utility network,MCISUN)来拟合元素加入时的效用增量,从而灵活且可解释地建模集合效用.区别于以往基于池化层的排列不变性建模算法,MCISUN构建顺序敏感的中间结果,利用集合的排列不变性实现数据增强,有效提升模型数据效率及泛化性.最后,大规模真实薪酬数据上的实验结果表明所提模型在基于技能的薪酬预测任务上比最先进的(state-of-the-art,SOTA)模型效果提升超过30%.同时,定性实验证明模型能够为技能设置合理的贡献值且发现技能间的关联.

    集合效用建模边际贡献薪酬预测神经网络可解释性

    基于多粒度特征交叉剪枝的点击率预测模型

    白婷刘轩宁吴斌张梓滨...
    1290-1298页
    查看更多>>摘要:在推荐系统中,学习有效的高阶特征交互是提升点击率预测的关键.现有的研究将低阶特征进行组合来学习高阶交叉特征表示,导致模型的时间复杂度随着特征维度的增加呈指数型增长;而基于深度神经网络的高阶特征交叉模型也无法很好地拟合低阶特征交叉,影响预测的准确率.针对这些问题,提出了基于多粒度特征交叉剪枝的点击率预测模型FeatNet.该模型首先在显式的特征粒度上,通过特征剪枝生成有效的特征集合,保持了不同特征组合的多样性,也降低了高阶特征交叉的复杂度;基于剪枝后的特征集合,在特征元素粒度上进一步进行隐式高阶特征交叉,通过滤波器自动过滤无效的特征交叉.在2个真实的数据集上进行了大量的实验,FeatNet都取得了最优的点击率预测效果.

    点击率预测高阶特征交叉多粒度特征剪枝特征降噪

    融入知识图谱和课程学习的对话情绪识别

    杜金明孙媛媛林鸿飞杨亮...
    1299-1309页
    查看更多>>摘要:对话领域情绪识别是基于对话的情感分类任务,对话数据具有口语化、主题跨度大和标签具有语义相似性的特点.口语化表现为对话中存在隐含常识和语法知识的二义性词语和省略句,导致模型难以准确建模语义信息;主题跨度大表现为不同对话场景下的文本信息丰富度差异大、情绪转移频率差异大,导致模型性能下降.提出CK-ERC模型缓解上述问题,在预训练阶段,抽取结构化数据为模型融入常识和语法知识图谱,帮助模型建模口语化信息;在微调阶段引入监督对比学习任务帮助模型识别相似情绪标签;在训练策略上设计了基于动态阈值的课程学习策略,按照文本丰富度从高到低、情绪转移频率从低到高的策略优化模型.CK-ERC模型在双人对话、多人对话、模拟对话、日常对话等多种对话模式下显著优于其他模型,在MELD和EmoryNLP数据集上获得最佳表现.

    对话情绪识别对比学习知识图谱课程学习迁移学习

    基于样本内外协同表示和自适应融合的多模态学习方法

    黄学坚马廷淮王根生
    1310-1324页
    查看更多>>摘要:多模态机器学习是一种新的人工智能范式,结合各种模态和智能处理算法以实现更高的性能.多模态表示和多模态融合是多模态机器学习的2个关键任务.目前,多模态表示方法很少考虑样本间的协同,导致特征表示缺乏鲁棒性,大部分多模态特征融合方法对噪声数据敏感.因此,在多模态表示方面,为了充分学习模态内和模态间的交互,提升特征表示的鲁棒性,提出一种基于样本内和样本间多模态协同的表示方法.首先,分别基于预训练的BERT,Wav2vec 2.0,Faster R-CNN提取文本特征、语音特征和视觉特征;其次,针对多模态数据的互补性和一致性,构建模态特定和模态共用2类编码器,分别学习模态特有和共享2种特征表示;然后,利用中心矩差异和正交性构建样本内协同损失函数,采用对比学习构建样本间协同损失函数;最后,基于样本内协同误差、样本间协同误差和样本重构误差设计表示学习函数.在多模态融合方面,针对每种模态可能在不同时刻表现出不同作用类型和不同级别的噪声,设计一种基于注意力机制和门控神经网络的自适应的多模态特征融合方法.在多模态意图识别数据集MIntRec和情感数据集CMU-MOSI,CMU-MOSEI上的实验结果表明,该多模态学习方法在多个评价指标上优于基线方法.

    多模态表示多模态融合多模态学习协同表示自适应融合

    基于深度语义分析的警务卷宗知识抽取

    马健伟王铁鑫江宏陈涛...
    1325-1335页
    查看更多>>摘要:卷宗作为公安机关办案、结案的主要记录,包含大量关键的警务信息.面向警务卷宗的信息抽取是分析案情、挖掘犯罪趋势、提高治安管理水平的重要手段.卷宗类文本多由基层警务人员采用 自然语言书写,关键信息抽取难度大.传统的警务卷宗信息抽取,多依赖人工及预定义模板,效率低且通用性差.针对以上问题,参考卷宗的警务特征,提出了一种基于深度语义分析的卷宗知识抽取方法.该方法包含命名实体识别与关系抽取2个核心内容.提出的命名实体识别方法,融合了汉字结构特征和字形特征;提出的关系抽取方法建立在实体识别的基础上,实现基于触发规则和触发词的2种抽取模式.在公开的微博数据集、项目合作方**市**分局的真实卷宗集上,提出的命名实体识别方法对比基线方法,在实体识别精确率及召回率上综合表现优异;自动抽取的关系也得到**分局的认可.相关信息系统已在**分局部署使用.

    智慧警务警务卷宗知识抽取命名实体识别关系抽取

    联合语义分割的自监督单目深度估计方法

    宋霄罡胡浩越宁靖宇梁莉...
    1336-1347页
    查看更多>>摘要:研究深度估计和语义分割的图像之间的互利关系,提出了 一种联合语义分割的自监督单目深度估计方法USegDepth.语义分割和深度估计任务通过共享编码器,实现语义引导.为了进一步提高编码器的跨多任务性能,设计了多任务特征提取模块,堆叠该模块构成共享编码器,解决有限感受野和缺乏跨通道交互导致的模型特征表示能力欠佳问题,进一步提升模型精度.同时,提出跨任务交互模块,通过双向的跨域信息交互细化特征表示,提升深度估计表现,特别是光度一致性监督有限的弱纹理区域和物体边界.通过在KITTI数据集上的训练和全面评估,实验结果显示所提的USegDepth模型方法的均方相对误差相比于SGDepth降低了 0.176个百分点,在阈值为1.253的阈值精度达到了 98.4%,证明了 USegDepth在深度预测上具有较高的准确率.

    自监督深度学习深度估计语义分割多任务联合共享编码器