首页期刊导航|计算机科学
期刊信息/Journal information
计算机科学
计算机科学

朱完元

月刊

1002-137X

jsjkx12@163.com

023-63500828

401121

重庆市渝北区洪湖西路18号

计算机科学/Journal Computer ScienceCSCD北大核心CSTPCD
查看更多>>本刊的读者对象是:大专院校师生,从事计算机科学与技术领域的科研、生产人员。办刊宗旨是:坚持“双百”方针,活跃计算机科学与技术领域的学术气氛,重点报导国内外计算机科学与技术的发展动态,为我国的计算机科学与技术立于世界之林、达到国际先进水平奋斗而矢志不渝。
正式出版
收录年代

    基于点云轨迹和压缩多普勒的跨场景手势识别

    张宏旺周瑞程宇刘辰旭...
    182-188页
    查看更多>>摘要:毫米波雷达能够用于各种感知任务,如活动识别、手势识别、心率感知等.手势识别作为其中的研究热点,可实现无接触人机交互.目前大多数手势识别研究使用点云或距离多普勒图通过神经网络进行识别感知,但是这些方法存在一些问题.首先,这些方法鲁棒性较差,被感知人员或其位置发生变化都会影响接收到的毫米波信号,降低感知精度.其次,这些方法将完整的距离多普勒图输入神经网络进行识别,由于图中存在较多与感知任务无关的区域,模型复杂且难以专注于感知任务.为解决这些问题,首先从连续多帧点云数据中建立手势轨迹,然后将连续多帧距离多普勒图进行局部切割并压缩获得二维局部多普勒图,最后将点云轨迹和二维局部多普勒图分别经过神经网络特征提取后,对特征进行拼接,通过全连接神经网络进行分类.实验结果表明,所提方法专注于手势,能够达到98%的识别准确率,在人员变化和位置变化情况下对新用户和在新位置的识别准确率分别能够达到93%和92%,高于现有方法.

    毫米波雷达手势识别跨场景位置无关人无关

    LNG-Transformer:基于多尺度信息交互的图像分类网络

    王文杰杨燕敬丽丽王杰...
    189-195页
    查看更多>>摘要:鉴于Transformer的Self-Attention机制具有优秀的表征能力,许多研究者提出了基于Self-Attention机制的图像处理模型,并取得了巨大成功.然而,基于Self-Attention的传统图像分类网络无法兼顾全局信息和计算复杂度,限制了 Self-Atten-tion的广泛应用.文中提出了 一种有效的、可扩展的注意力模块Local Neighbor Global Self-Attention(LNG-SA),该模块在任意时期都能进行局部信息、邻居信息和全局信息的交互.通过重复级联LNG-SA模块,设计了一个全新的网络,称为LNG-Transformer.该网络整体采用层次化结构,具有优秀的灵活性,其计算复杂度与图像分辨率呈线性关系.LNG-SA模块的特性使得LNG-T ransformer即使在早期的高分辨率阶段,也可以进行局部信息、邻居信息和全局信息的交互,从而带来更高的效率、更强的学习能力.实验结果表明,LNG-Transformer在图像分类任务中具有良好的性能.

    图像分类自注意力机制多尺度Transformer

    基于Depth-wise卷积和视觉Transformer的图像分类模型

    张峰黄仕鑫花强董春茹...
    196-204页
    查看更多>>摘要:图像分类作为一种常见的视觉识别任务,有着广阔的应用场景.在处理图像分类问题时,传统的方法通常使用卷积神经网络,然而,卷积网络的感受野有限,难以建模图像的全局关系表示,导致分类精度低,难以处理复杂多样的图像数据.为了对全局关系进行建模,一些研究者将Transformer应用于图像分类任务,但为了满足Transformer的序列化和并行化要求,需要将图像分割成大小相等、互不重叠的图像块,破坏了相邻图像数据块之间的局部信息.此外,由于Transformer具有较少的先验知识,模型往往需要在大规模数据集上进行预训练,因此计算复杂度较高.为了同时建模图像相邻块之间的局部信息并充分利用图像的全局信息,提出 了一种基于 Depth-wise 卷积的视觉 Transformer(Efficient Pyramid Vision Transformer,EPVT)模型.EPVT模型可以实现以较低的计算成本提取相邻图像块之间的局部和全局信息.EPVT模型主要包含3个关键组件:局部感知模块(Local Perceptron Module,LPM)、空间信息融合模块(Spatial Information Fusion,SIF)和"+卷积前馈神经网络(Convolution Feed-forward Net work,CFFN).LPM模块用于捕获图像的局部相关性;SIF模块用于融合相邻图像块之间的局部信息,并利用不同图像块之间的远距离依赖关系,提升模型的特征表达能力,使模型学习到输出特征在不同维度下的语义信息;CFFN模块用于编码位置信息和重塑张量.在图像分类数据集ImageNet-1K上,所提模型优于现有的同等规模的视觉Transformer分类模型,取得了 82.6%的分类准确度,证明了该模型在大规模数据集上具有竞争力.

    深度学习图像分类Depth-wise卷积视觉Transformer注意力机制

    基于递归门控卷积的遥感图像超分辨率研究

    刘长新吴宁胡俐蕊高霸...
    205-216页
    查看更多>>摘要:由于受到硬件条件的限制,通常难以获得具有高分辨率(HR)的遥感图像.利用单幅图像超分辨率(SISR)技术对低分辨率(LR)遥感图像进行超分辨率重建是获取高分辨率遥感图像的常用方法.近年来,在图像超分辨率领域引入的卷积神经网络(CNN)改进了图像重建性能.然而,现有的基于CNN的超分辨率模型通常使用低阶注意力机制提取深层特征,其表征能力有待提高,且常规卷积的感受野有限,缺乏对远距离依赖关系的学习.为了解决以上问题,提出了一种基于递归门控卷积的遥感图像超分辨率方法RGCSR.该方法引入递归门控卷积gnConv学习全局依赖和局部细节,通过高阶空间交互来获取高阶特征.首先,使用由高阶交互子模块(HorBlock)和前馈神经网络(FFN)组成的高阶交互——前馈神经网络模块(HFB)提取高阶特征.其次,利用由通道注意力(CA)和gnConv构建的特征优化模块(FOB)优化各个中间模块的输出特征.最后,在多个数据集上的对比结果表明,RGCSR比现有的基于CNN的超分辨率方法具备更好的重建性能和视觉效果.

    递归门控卷积高阶空间交互通道注意力遥感图像超分辨率

    低资源场景事件抽取研究综述

    刘涛蒋国权刘姗姗刘浏...
    217-237页
    查看更多>>摘要:事件抽取作为信息抽取的任务之一,旨在从非结构化文本中抽取出结构化事件信息.当前基于机器学习和深度学习的自动化信息抽取方法过度依赖于标注数据,而大多数领域的标准数据集规模很小且分布不均匀,因此低资源场景成为了限制自动化信息抽取性能的瓶颈.虽然,近年来众多学者针对低资源场景进行了深入研究,并取得了许多显著的成果,但目前针对该场景下的事件抽取研究综述比较缺乏.文中对现有的学术成果进行了较为全面的总结分析,首先介绍了相关任务的定义,并将低资源场景事件抽取任务分为3类;其次围绕此分类重点阐述了 6种相关技术方法,包括基于迁移学习、基于提示学习、基于无监督学习、基于弱监督学习、基于数据与辅助知识增强、基于元学习的方法,并指出了当前方法的不足和未来改进的方向;然后介绍了相关数据集及评价指标,并对典型技术方法的实验结果进行了总结分析;最后从全局角度总结分析了当前低资源场景事件抽取工作面临的挑战及未来研究的趋势.

    事件抽取低资源场景数据处理场景适应

    基于改进自注意力机制和表示学习的分层文档分类方法

    廖兴滨钱杨舸王乾垒秦小林...
    238-244页
    查看更多>>摘要:文档分类的一项基本工作是研究如何高效地表示输入特征,句子和文档向量表示也可以辅助自然语言处理的下游任务,如文本情感分析和数据泄露预防等.特征表示也逐渐成为文档分类问题的性能瓶颈和模型可解释性的关键之一.针对现有分层模型面临的大量重复计算以及可解释性缺乏的问题,提出了一种分层文档分类模型,并研究了句子和文档表示方法对文档分类问题的性能影响.所提模型集成了使用改进自注意力机制融合输入特征向量的句子编码器和文档编码器,形成了一个层次结构,以实现对文档级数据的分层处理,在简化计算的同时增强了模型的可解释性.与仅使用预训练语言模型的特殊标记向量作为句子表示的模型相比,所提模型在5个公开文档分类数据集上实现了平均4%的性能提升,比使用词向量矩阵的注意力输出均值的模型提高了 2%.

    句子表示文档表示注意力机制文档分类模型可解释性

    基于主动学习和二次有理核的模型无关局部解释方法

    周晟昊袁伟伟关东海
    245-251页
    查看更多>>摘要:深度学习模型的广泛使用,在更大程度上使人们意识到模型的决策是亟需解决的问题,复杂难以解释的黑盒模型阻碍了算法在实际场景中部署.LIME作为最流行的局部解释方法,生成的扰动数据却具有不稳定性,导致最终的解释产生偏差.针对上述问题,提出了一种基于主动学习和二次有理核的模型无关局部解释方法ActiveLIME,使得局部解释模型更加忠于原始分类器.ActiveLIME生成扰动数据后,通过主动学习的查询策略对扰动数据进行采样,筛选不确定性高的扰动集训练,使用迭代过程中准确度最高的局部模型对感兴趣实例生成解释.并且,针对容易陷入局部过拟合的高维稀疏样本,在模型损失函数中引入了二次有理核来减少过拟合.实验结果表明,所提出的ActiveLIME方法引比传统局部解释方法具有更高的局部保真度和解释质量.

    局部解释扰动采样主动学习查询策略二次有理核

    2023年"CCF最高科学技术奖"评选结果公告

    CCF微信公众号
    251页

    基于互信息优化的Option-Critic算法

    栗军伟刘全徐亚鹏
    252-258页
    查看更多>>摘要:时序抽象作为分层强化学习的重要研究内容,允许分层强化学习智能体在不同的时间尺度上学习策略,可以有效解决深度强化学习难以处理的稀疏奖励问题.如何端到端地学习到优秀的时序抽象策略一直是分层强化学习研究面临的挑战.Option-Critic(OC)框架在Option框架的基础上,通过策略梯度理论,可以有效解决此问题.然而,在策略学习过程中,OC框架会出现Option内部策略动作分布变得十分相似的退化问题.该退化问题影响了 OC框架的实验性能,导致Option的可解释性变差.为了解决上述问题,引入互信息知识作为内部奖励,并提出基于互信息优化的Option-Critic算法(Option-Critic Algo-rithm with Mutual Information Optimization,MIOOC).MIOOC 算法结合了 近端策略 Option-Critic(Proximal Policy Option-Critic,PPOC)算法,可以保证下层策略的多样性.为了验证算法的有效性,把MIOOC算法和几种常见的强化学习方法在连续实验环境中进行对比实验.实验结果表明,MIOOC算法可以加快模型学习速度,实验性能更优,Option内部策略更有区分度.

    深度强化学习时序抽象分层强化学习互信息内部奖励Option多样性

    基于最大间隔和流形假设的半监督学习算法

    戴伟柴晶刘雅娇
    259-267页
    查看更多>>摘要:半监督学习是一种介于监督学习和无监督学习之间的弱监督学习模式,其在学习过程中将少量标记示例和大量未标记示例结合起来构建模型,以期取得比监督学习仅使用标记示例更高的学习精度.在该学习模式下,文中提出了 一种将最大间隔准则和示例空间的流形假设思想相结合的半监督学习算法.该算法在利用示例流形结构估计未标记示例标记置信度的同时利用最大间隔准则构建分类模型,并采用交叉优化方法以迭代的方式交替地求解分类模型参数和标记置信度.在12个UCI数据集和4个由MNIST手写数字集生成的数据集上的实验结果表明,采用半监督直推学习方式,该算法的性能优于其他对比算法的情况为60.5%;采用半监督归纳学习方式,该算法的性能优于其他对比算法的情况为42.6%.

    半监督学习最大间隔流形假设标记置信度支持向量机