首页期刊导航|计算机学报
期刊信息/Journal information
计算机学报
计算机学报

高文

月刊

0254-4164

cjc@ict.ac.cn

010-62620695

100190

中国科学院计算技术研究所(北京2704信箱)

计算机学报/Journal Chinese Journal of ComputersCSCD北大核心CSTPCDEI
查看更多>>本刊是中国计算机领域的有代表性学术刊物,作为一种科学研究档案,代表了计算机领域各个研究阶段的水平。本刊被《工程索引》(美国)、《科学文摘》(英国)、《数学文摘》(美国)、《科技文献速报》(日本)、《文摘杂志》(俄罗斯)等多种权威系统收录。是科技部科技信息研究所科技论文统计源期刊、中国科学引文数据库来源期刊。
正式出版
收录年代

    面向智能物联网的资源高效模型推理综述

    袁牧张兰姚云昊张钧洋...
    2247-2273页
    查看更多>>摘要:从智慧城市到工业自动化,智能物联网在越来越多的场景中得到了广泛应用.模型推理作为实现智能决策和响应的核心技术,在智能物联网系统中扮演着举足轻重的角色.然而,智能物联网设备通常在计算能力、通信带宽、内存容量和电池寿命等资源上高度受限.这使得智能物联网中的模型推理资源开销成为一个关键技术挑战.本综述总结了在智能物联网场景中优化模型推理资源开销的相关技术,对当前在智能物联网应用中使用的主流模型推理优化技术进行概述,并深入分析它们在资源效率方面的优势和不足.本文从推理涉及的三大模块(传感器数据、智能模型、物联网硬件)和五类关键资源的角度出发设计新的技术分类,并首次提出了一套针对智能物联网模型推理的通用的优化流程,能够帮助相关研发人员定位和优化推理效率瓶颈.最后,本文讨论了智能物联网推理效率相关的四个未来研究方向.

    智能物联网模型推理资源效率输入过滤协同推理

    基于掩膜自动编码器的对抗对比蒸馏算法

    张点董云卫
    2274-2288页
    查看更多>>摘要:随着人工智能的不断发展,神经网络对不同领域的任务都表现出了优异的性能.然而,对抗样本的存在对神经网络在安全相关领域中的应用提出了挑战.为了改善对抗训练耗时和对抗样本缺乏多样性的问题,本文提出一种使用改进掩膜自动编码器训练教师网络的对比蒸馏算法抵御对抗攻击.首先,为了减弱教师模型对图像全局特征的依赖,教师模型在改进的掩膜自动编码器中学习如何根据可见子块推理遮挡子块的特征.然后,为了减弱对抗干扰的影响,本文采用知识蒸馏和对比学习的方法提升目标模型的对抗鲁棒性,通过知识蒸馏转移教师模型的特征到学生模型减少模型对全局特征的依赖,通过对比学习提升学生模型对图像之间细节特征的识别能力.最后,本文采用标签信息对分类头进行调节确保识别准确率.在ResNet50和WideResNet50中进行的实验表明,CIFAR-10中对抗准确率平均提升11.50%;CIFAR-100中对抗准确率平均提升6.35%.实验结果证明基于掩膜自动编码器的对比蒸馏算法能够通过只生成一次对抗样本减弱对抗干扰的影响,并通过随机掩膜构建多样本视角提升样本多样性,增强神经网络对抗鲁棒性.

    神经网络对抗样本对抗训练掩膜自动编码器对比蒸馏对抗鲁棒性

    混合曲率空间中的几何自适应元学习方法

    高志武玉伟贾云得
    2289-2306页
    查看更多>>摘要:元学习通过学习先验知识,能帮助模型快速适应新任务.在适应新任务的过程中,空间几何结构与数据几何结构的匹配程度对模型泛化起着重要作用.现实世界数据具有多样的非欧几何结构,例如自然语言具有非欧层级结构,人脸图像具有非欧环状结构等.已有研究表明,真实数据的非欧结构同黎曼流形的几何结构相匹配,从理论上提供了利用黎曼流形来建模数据的可行性.本文提出了混合曲率空间(mixed-curvature space)中的几何自适应元学习方法,利用多个混合曲率空间来表示数据,并生成与数据非欧结构相匹配的黎曼几何.本文构建了多混合曲率神经网络,将混合曲率空间的几何结构表示为曲率空间的曲率、数量和维度,由此通过梯度下降过程实现对数据非欧结构的几何自适应.本文进一步引入几何初始化生成策略和几何更新策略,通过少数几步迭代,空间几何结构即可快速匹配数据非欧结构,加速了梯度下降过程.本文在小样本分类和小样本回归等任务上进行了实验验证.与欧氏空间的元学习方法相比,本文方法在小样本分类任务上取得了约3%的准确率提升,在小样本回归任务上将均方误差减少了一半,验证了本文方法的有效性.

    元学习几何自适应混合曲率空间黎曼流形

    基于因果推断的推荐系统去偏研究综述

    杨新新刘真卢思博袁亚凡...
    2307-2332页
    查看更多>>摘要:推荐系统是解决信息过载的重要技术之一.然而,推荐系统中存在各种各样的偏差问题,影响了对用户真实偏好的建模,制约了推荐性能的提升.近年来,因果推断理论的发展为分析和解决推荐系统偏差问题提供了有力的支持.因果推断是一种从观测数据中识别变量之间因果关系和估计因果效应的统计学方法,通过构建和分析因果模型,帮助推荐系统识别和消除偏差,提高对用户偏好拟合的准确性.本文对基于因果推断的推荐系统去偏研究的主要工作进行了全面的综述.本文根据推荐系统的不同阶段将偏差的产生分为三个阶段;首先,概述了因果推断的原理和方法,并阐述了因果推断与推荐去偏之间的联系,为缓解偏差问题提供了思路;接着,针对每一阶段的偏差,探讨了现有的因果推断技术如何应用于推荐去偏,分类和归纳了现有的因果推荐去偏方法,并进行了详细的对比分析;最后,讨论和展望了基于因果推断的推荐系统去偏研究未来的发展趋势.

    推荐系统去偏因果推断偏差反事实推理

    从众性感知的因果去偏新闻推荐方法

    鲍纪敏张琨吴乐洪日昌...
    2333-2351页
    查看更多>>摘要:基于神经网络的新闻推荐算法能够从纷繁复杂的新闻中筛选出符合用户偏好的新闻,对于提升用户获取信息的效率以及阅读新闻的体验具有重要的意义.现有的新闻推荐方法不仅在用户偏好的准确建模方面取得了显著的效果,同时通过识别新闻数据中的虚假关联(例如用户性别与特定新闻类别之间的联系)开展了无偏新闻推荐的初步尝试.然而用户的新闻点击行为是一系列复杂认知行为相互作用之后的决策结果,仅对有偏信息进行直接建模,简化了有偏信息和用户行为之间的复杂交互关系,忽略了用户行为背后的复杂认知因素的影响,导致无偏推荐效果难以满足实际需求.为了解决该问题,本文提出一种全新的从众性感知的因果去偏新闻推荐方法CADNN(Conformity-A ware Debiased Neural News Recommendation).具体而言,本文提出用户的点击行为包括以下三方面:用户偏好与新闻的匹配度,新闻的流行度,以及用户的从众性特质共同决定的观点.用户的从众性越低,新闻的流行度越小,相对应的点击行为越能反映出用户的真实偏好.基于该观点,本文首先对用户的历史点击数据进行了详细的统计分析,从中提取出反映用户行为的关键特征,根据统计分析结果构建能够描述用户偏好、新闻流行度和从众性特质之间关系的因果图模型,通过因果图模型更准确地理解和描述用户点击行为背后的驱动因素.在此基础上,本文提出一种全新的从众性建模方法,同时从用户的从众性特质和新闻的流行度两个角度进行更符合实际情况的从众性建模;与此同时本文利用现有的新闻推荐方法计算用户偏好和新闻内容的匹配度.最终在对三方面因素充分建模的情况下,实现更高质量的无偏新闻推荐.最后,本文在公开的数据集MIND上进行了充分的实验验证,并构建了一个用于无偏测试的挑战集,旨在评估推荐系统在无偏环境中的鲁棒性,与已有的最先进的基准方法相比,本文提出的CADNN方法在AUC、MRR、NDCG@5和NDCG@10四个指标上分别平均提高了 1.76%、2.37%、3.06%和2.16%,充分证明了 CADNN方法的有效性.本文同时提供了 CADNN的实现代码及相关数据,用于支持推动相关领域的研究.

    新闻推荐从众性偏差因果推断去偏表征点击预测

    基于一致性感知特征融合的高动态范围成像方法

    印佳丽韩津陈斌刘西蒙...
    2352-2367页
    查看更多>>摘要:高动态范围成像(High Dynamic Range Imaging,HDRI)技术是指通过融合多张低动态范围(Low Dynamic Range,LDR)图像拓展图像动态范围、完整图像内容的方法,其为解决由于相机传感器动态范围有限而导致所拍摄图像内容丢失的问题提供了实际的解决方案.通过数十年的研究,众多有效的HDRI方法已被提出,并在无物体运动、内容曝光良好的静态场景中取得接近最优的性能.然而,现实场景中物体移动和相机偏移无法避免,直接使用传统HDRI方法会在融合后的HDR图像中产生严重的重影和伪影.这使得仅包含简单融合过程的HDRI方法并不适用于实际应用,现实场景中的HDRI任务仍然具有一定挑战.因此,针对动态场景下的HDRI研究迅速发展.近期的方法集中在借助深度卷积神经网络(Convolutional Neural Network,CNN)的力量以期实现更好的性能.在这些基于CNN的方法中,特征融合对于恢复图像完整内容、消除图像伪影方面起着至关重要的作用.传统的特征融合方法通过借助跳跃连接或注意力模块,首先将LDR图像的特征进行拼接,并通过堆叠的卷积操作逐渐关注不同的局部特征.然而,此类方案通常忽略了 LDR图像序列之间丰富的上下文依赖关系,且未充分利用特征之间的纹理一致性.为解决这一问题,本文提出了一种全新的一致性感知特征融合(Coherence-Aware Feature Aggregation,CAFA)方案,该方案在卷积过程中对输入特征中位于不同空间位置但具有相同上下文信息的特征信息进行采样,从而显式地将上下文一致性纳入特征融合中.基于CAFA,本文进一步提出了一种结合CAFA的动态场景下一致性感知高动态范围成像网络CAHDRNet.为更好地嵌合CAFA方案,本文通过设计三个额外的可学习模块来构建CAHDRNet.首先,使用基于在ImageNet上预训练的VGG-19构建可学习特征提取器,并在模型训练期间不断更新该特征提取器的参数.这种设计可实现LDR图像的联合特征学习,为CAFA中的上下文一致性评估奠定了坚实基础.接着,应用所提出的CAFA模块,通过在图像特征中采样具有相同上下文的信息进行特征融合.最后,本文提出使用一种多尺度残差补全模块来处理融合后的特征,利用不同扩张率进行特征学习,以实现更强大的特征表示并在图像缺失区域中进行可信细节填充.同时,设计一个软注意力模块来学习不同图像区域的重要性,以便在跳跃连接期间获得与参考图像互补的所需特征.多种实验验证了 CAHDRNet的有效性并证实其优于现有最先进的方法.具体而言,本文所提出的CAHDRNet在Kalantari数据集上HDR-VDP-2和PSNR-L等指标相较于次好方法AHDRNet分别提升了 1.61和0.68.

    高动态范围成像图像融合特征融合上下文一致性卷积采样

    上下文建模与推理的视频异常事件检测

    孙澈武玉伟贾云得
    2368-2386页
    查看更多>>摘要:视频异常事件检测旨在从视频中自动地检测出不符合正常事件规律的视频事件.视频中许多正常和异常的事件是由目标与场景或其它目标交互而产生的,即它们是以目标为中心且高度上下文相关的.如何从底层的视频特征中提取事件高层语义上下文信息,并根据上下文信息进行视频异常事件检测仍是一个开放的难题.为此,本文提出了一种新的上下文建模与推理的视频异常事件检测方法.本文方法通过建立视频的上下文图,自动地推理事件相关的语义上下文信息,以缩小底层视觉特征与异常事件高层语义之间的差距,实现异常事件检测.具体来说,首先使用了预训练的目标检测网络,提取目标初始的表观特征、目标之间的时空关系特征和场景特征;其次设计了一个上下文图推理模块,通过建模时空上下文图,将提取到的特征显式地建模为三类语义上下文,包括事件目标的个体行为、不同目标之间的时空关系以及目标与场景之间的交互,其中图的节点表示目标/场景,图的边表示时空关系;最后构建了一个异常预测模块,根据推理到的语义上下文信息进行异常事件检测.本文的上下文图推理模块基于平均场理论,通过使用多个带有消息传递模块的循环神经网络,迭代更新图的节点和边的状态,目的是从底层的视觉特征中推理得到高层的语义上下文.本文的异常预测模块包括注意力池化网络层和全连接网络层,通过输入语义上下文信息,计算视频帧的异常分数,从而正确地进行异常事件检测.实验中,设计了一个自训练策略,分别使用了无监督、半监督、弱监督和监督四种训练策略,以端到端的方式训练时空上下文图推理模块和异常预测模块.本文方法在四个公开的数据集上进行了实验,包括三个半监督的数据集Subway(Entrance/Exit)、Avenue和ShanghaiTech,以及一个监督的数据集UCF-Crime.与不使用上下文的方法相比,本文方法在Subway(Entrance/Exit)、Avenue和ShanghaiTech数据集上的无监督AUC指标分别提高了 2.7%/3.1%、2.0%和2.9%,半监督AUC指标分别提高了 3.5%/3.3%、4.0%和4.3%.在监督数据集UCF-Crime上,与没有使用上下文的方法相比,本文方法在半监督AUC、弱监督AUC和监督AUC的指标上分别提高了 2.1%、0.4%和9.2%,取得了有竞争力的表现.

    异常事件检测上下文建模与推理上下文图自训练策略深度学习

    精细化局部语义与属性学习的行人重识别

    肖进胜吴婧逸郭浩文郭圆...
    2387-2400页
    查看更多>>摘要:行人的随身物品信息与属性描述是提高行人重识别任务性能的有效途径.本文提出了一种精细化局部语义与属性学习的行人重识别网络,来提取行人的随身物品信息,同时从语义区域中获得行人的属性描述.首先,将特征聚类方法生成的随身物品区域融合到额外语义模型生成的语义解析结果中,解决目前较多额外语义解析模型遗漏行人随身物品信息的问题.其次,利用生成的语义区域作为身体标签,网络由全局特征构建这些区域的语义特征映射,然后从语义特征中预测与之相关的属性信息,增强行人的描述.最后,考虑到行人某些属性之间包含强相关性,重新构建加权模型来提高某些属性的置信分数,优化属性的预测准确率.将属性预测结果和行人的全局特征连接在一起,形成行人的鲁棒特征表示.在Market-1501和DukeMTMC-reID属性数据集上的实验表明,所提算法较基线网络分别得到了 3.6%和6.4%的mAP指标增益,可以提高行人重识别任务的性能.

    语义分析属性预测相关性行人重识别

    基于视觉提示学习的天气退化图像恢复

    文渊博高涛安毅生李子琦...
    2401-2416页
    查看更多>>摘要:尽管现有的天气退化图像恢复方法在单一天气去除任务上已经取得良好表现,但其无法适应真实场景下多变的天气类型.为此,本文提出一种基于视觉提示学习的天气退化图像恢复算法,其是预训练语言图像模型与天气退化图像恢复任务结合的新范式.该算法首先设计一个查询提示约束网络(Query Prompt Contrained Network,QPC-Net),其利用对比语言图像预训练模型中的文本编码器和图像编码器来根据给定的退化图像直接编码其对应真实背景的潜在描述特征.同时,该算法还包括一个示例提示引导网络(Example Prompt Guided Network,EPG-Net),其利用给定的示例图像来引导预训练扩散模型去除查询图像上对应的天气退化.相比类似设定的现有算法,本文算法在8个天气退化数据集上平均改善峰值信噪比2.11dB,平均改善结构相似性4.74%.

    计算机视觉视觉提示学习情境学习图像恢复扩散模型

    小样本语义分割研究现状与分析

    陈善娟于云龙李英明
    2417-2451页
    查看更多>>摘要:传统语义分割任务通常是数据驱动的,需要大规模密集标注样本训练,并且不能泛化到新类,因此在实际应用中受到很大限制.为了缓解传统语义分割中数据匮乏和泛化能力差的问题,人们提出小样本语义分割任务,在未见类别仅提供少量密集标注样本的情况下实现新类分割,在医疗图像分割、自动驾驶等应用领域扮演着重要的角色,已成为计算机视觉领域的重要研究方向之一.本文从基础知识、模型算法和拓展应用等方面对自然图像领域的小样本语义分割研究展开调查,具体包含以下内容:(1)介绍了小样本语义分割的背景知识,包括它的由来、核心思想、概念知识、存在挑战、数据集和性能评价指标;(2)详细分析和比较当前小样本语义分割算法,根据推理过程中是否存在梯度回传将其分为基于优化和基于度量学习的方法,并归纳了其发展现状和不同算法的优缺点;(3)介绍了小样本语义分割与其他技术融合的任务,包括小样本实例分割、广义小样本分割、增量小样本分割、弱监督小样本分割及跨域小样本分割;(4)讨论了小样本语义分割任务仍存在的问题和未来展望.

    小样本学习图像语义分割元学习迁移学习深度学习