首页期刊导航|计算机科学
期刊信息/Journal information
计算机科学
计算机科学

朱完元

月刊

1002-137X

jsjkx12@163.com

023-63500828

401121

重庆市渝北区洪湖西路18号

计算机科学/Journal Computer ScienceCSCD北大核心CSTPCD
查看更多>>本刊的读者对象是:大专院校师生,从事计算机科学与技术领域的科研、生产人员。办刊宗旨是:坚持“双百”方针,活跃计算机科学与技术领域的学术气氛,重点报导国内外计算机科学与技术的发展动态,为我国的计算机科学与技术立于世界之林、达到国际先进水平奋斗而矢志不渝。
正式出版
收录年代

    结合多粒度特征融合的自然场景文本检测方法

    陈卓王国胤刘群
    243-248页
    查看更多>>摘要:自然场景下的文本信息通常具有多样性和复杂性的特点.由于采用手工设计特征的方式,传统的自然场景文字检测方法缺乏鲁棒性,而已有的基于深度学习的文本检测方法在各层网络提取特征的过程中存在丢失重要特征信息的问题.文中从多粒度和认知学的角度,提出了一种结合多粒度特征融合的自然场景文本检测方法.该方法的主要贡献是通过对通用特征提取网络的不同粒度特征进行融合,并加入残差通道注意力机制,使得模型在充分学习图像中不同粒度特征信息的基础上,更加关注目标特征信息并抑制无用的信息,提升了模型的鲁棒性和准确率.实验结果表明,相比其他最新的方法,该方法在公开数据集上取得了85.3%的准确率和82.53%的F值,具有更好的性能.

    特征提取多粒度信息残差注意力卷积神经网络

    基于多级文本检测的复杂文档图像扭曲矫正算法

    寇喜超张鸿锐冯杰郑雅羽...
    249-255页
    查看更多>>摘要:文档的扭曲矫正是进行文档OCR(Optical Character Recognition)的基础步骤,对提高OCR的准确率有重要作用.文档图像的扭曲矫正常常依赖于文本的提取,然而目前文档图像矫正算法大都无法对复杂文档中的文本进行准确定位和分析,导致其矫正效果不理想.针对此问题,提出了一种基于全卷积网络的文字检测框架,并使用合成文档对网络进行针对性训练,可实现对字符、词、文本行三级文本信息的准确获取,进而对文本进行自适应采样并利用三次函数对页面进行三维建模,将矫正问题转化为模型参数优化问题,达到矫正复杂文档图像的目的.使用合成扭曲文档以及真实测试数据进行矫正实验,结果表明,提出的矫正方法能够对复杂文档进行精确的文本提取,明显改善了复杂文档图像矫正后的视觉效果,相比于其他算法,该算法矫正后OCR的准确率得到显著提高.

    卷积神经网络文本检测文档三维建模文档图像矫正光学字符识别

    夜间行驶车辆远光灯检测方法

    龚航刘培顺
    256-263页
    查看更多>>摘要:有效地对夜间车辆违规使用远光灯的行为进行管理,可以降低夜间交通事故的发生,但目前缺乏高效的远光灯检测方法,相关交通法规无法得到有效执行.针对此问题,文中提出了一种夜间车辆远光灯检测深度学习算法.该算法基于YOLOv3进行设计,通过降低各层卷积层维数的方式,来减少整体网络的参数量,提高算法的运行速度;然后对网络的残差组件进行改进,使用标准的残差组件,同时设计了一个空洞卷积模块来加强网络局部和全局特征的融合,增强了网络的特征表达能力;接着对YOLOv3的损失函数进行了改进,优化小尺寸目标对坐标损失的贡献,增强了小尺度目标的检测能力;最后对YOLOv3先验框聚类算法和个数进行优化,提高模型的表达能力和检测速度.实验结果表明,所设计的算法的平均准确率(mAP)达到了99.09%,相比YOLOv3提升了30%,满足了实用化要求,能够有效地检测违规行为.

    交通管理远光灯检测深度学习YOLOv3残差网络空洞卷积

    基于相邻特征融合的目标检测

    李亚泽刘宏哲
    264-268页
    查看更多>>摘要:随着智能驾驶领域的发展,人们对目标检测的精度要求越来越高,尤其是针对高速行驶时对距离较远的小目标的检测和低速行驶时对密集目标的检测.在当前的两阶段检测框架的特征融合部分,使用bottom-up的双向融合方法虽然能够更有效地对大目标进行语义信息和位置信息的特征融合,但会给几个或几十个像素的小目标造成很大的信息损失.当检测网络特征融合部分使用top-down的单向融合方法时,则对大目标检测的效果欠佳.为此,文中提出了相邻特征融合(Neighbour Fea-ture Pyramid Network,NFPN)方法、Double RoI(Region of Interest)方法和递归特征金字塔(Recursive Feature Pyramid,RFP)的方法.以Faster RCNN 50为基准,同时使用提出的NFPN,Double RoI和RFP后,在Lisa交通数据集中平均精度(mAP)提升了2.6个百分点.在VOC2007数据集上,以VOC07+12 train数据集为训练集,VOC2007 test为测试集,以Faster RC-NN101为基准,同时使用提出的3个模型,mAP提升了6个百分点,同时小、中、大目标的精度也得到提高.

    深度学习目标检测计算机视觉特征融合智能驾驶

    基于多粒度区域相关深度特征学习的行人重识别

    董虎胜钟珊杨元峰孙逊...
    269-277页
    查看更多>>摘要:在对行人重识别的研究中,联合使用从图像中提取的全身与局部特征已经成为当前的主流方法.但是许多基于深度学习的重识别模型在提取局部特征时忽略了它们在空间上的相互联系,当不同行人具有局部相似的外观时,这些局部特征的辨别能力会受到很大影响.针对该问题,提出了一种学习多粒度区域相关特征的行人重识别方法.该方法在对骨干网络提取的卷积特征张量作不同粒度的区域划分后,设计了区域相关子网络模块来学习融入空间结构关系的各局部区域特征.在区域相关子网络模块中,为了赋予局部特征与其他区域相关联的空间结构信息,综合利用了平均池化运算的空间保持能力与最大池化运算的性能优势.通过对当前特征和其他各区域的局部特征进行联合处理,使各局部特征间产生很强的空间相关性,提升了特征判别能力.在区域相关子网络模块的设计上,采用了与深度残差网络相同的短路连接结构,使得网络更易于优化.最后,由全身特征与使用区域相关子网络增强后的各局部区域特征联合实现行人重识别.Market-1501,CUHK03,DukeMTMC-reID 3个公开数据集上的实验结果表明,所提算法取得了优于当前主流算法的行人身份匹配准确率,具有非常优秀的重识别性能.

    行人重识别深度学习特征表达池化操作区域相关网络

    检索式聊天机器人技术综述

    吴俣李舟军
    278-285页
    查看更多>>摘要:随着自然语言处理技术的飞速发展以及互联网上对话语料的不断积累,闲聊导向对话系统(简称聊天机器人)取得了令人瞩目的进展,受到了学术界的广泛关注,并在产业界进行了初步的尝试.当前,聊天机器人分为检索式聊天机器人和生成式聊天机器人,而检索式聊天机器人由于其生成的回复流畅且计算资源消耗小,仍然是目前工业界聊天机器人的主要实现手段.文中首先简要介绍了检索式聊天机器人的研究背景、基本架构以及组成模块,重点阐述了回复选择模块的约束要求和相关数据集;然后,针对检索式聊天机器人中最为核心的回复选择技术,进行了深入分析与详细梳理.文中将近年来经典的回复选择技术归纳为如下4类:基于统计模型的方法、基于表示的神经网络模型的方法、基于交互的神经网络模型的方法以及基于预训练技术的方法,并指出了这4类方法的优点和不足.在此基础上,分析了目前检索式聊天机器人技术研究所面临的问题,并对其未来的发展趋势进行了展望.

    自然语言处理聊天机器人文本匹配回复选择预训练技术

    基于深度学习的交互式问答研究综述

    黄欣雷刚曹远龙陆明名...
    286-296页
    查看更多>>摘要:相比传统的一问一答,交互式问答增加了对话上下文和背景等信息,这为理解用户输入和推理答案带来了新的挑战.首先,用户输入不再局限于问题,还可以是告知问题细节、反馈答案可行与否等带有意图的语句,因此需要理解对话中每个语句的意图.其次,交互式问答允许多个角色同时参与一个问题的讨论,为每个角色生成个性化的答案,因此需要理解对话中存在的角色.再次,当交互式问答围绕一段背景文本展开时,需要理解这段背景文本,并从中抽取出问题的答案.文章对交互式问答的发展及前沿动态进行了调研,分别对无背景交互式问答、有背景交互式问答以及迁移学习在交互式问答的应用3个子方向的新方法和新发现进行了介绍,并对交互式问答的研究前景进行了分析和展望.

    问答系统交互式问答背景信息预训练模型

    基于自指导动作选择的近端策略优化算法

    申怡刘全
    297-303页
    查看更多>>摘要:强化学习领域中策略单调提升的优化算法是目前的一个研究热点,在离散型和连续型控制任务中都具有了良好的性能表现.近端策略优化(Proximal Policy Optimization,PPO)算法是一种经典策略单调提升算法,但PPO作为一种同策略(on-policy)算法,样本利用率较低.针对该问题,提出了一种基于自指导动作选择的近端策略优化算法(Proximal Policy Optimiza-tion Based on Self-Directed Action Selection,SDAS-PPO).SDAS-PPO算法不仅根据重要性采样权重对样本经验进行利用,而且增加了一个同步更新的经验池来存放自身的优秀样本经验,并利用该经验池学习到的自指导网络对动作的选择进行指导.SDAS-PPO算法大大提高了样本利用率,并保证训练网络模型时智能体能快速有效地学习.为了验证SDAS-PPO算法的有效性,将SDAS-PPO算法与TRPO算法、PPO算法和PPO-AMBER算法用于连续型控制任务Mujoco仿真平台中进行比较实验.实验结果表明,该方法在绝大多数环境下具有更好的表现.

    强化学习深度强化学习策略梯度近端策略优化自指导

    基于改进鲸鱼算法的无人机三维路径规划

    郭启程杜晓玉张延宇周毅...
    304-311页
    查看更多>>摘要:无人机三维路径规划是一个比较复杂的全局优化问题,其目标是在考虑威胁和约束的条件下,获得最优或接近最优的飞行路径.针对鲸鱼算法在进行无人机三维航迹规划时,存在容易陷入局部最优、收敛速度较慢、收敛精度不够高等问题,提出了一种基于莱维飞行(Lévy flight)的鲸鱼优化算法(Levy Flight Based on Whale Optimization Algorithm,LWOA),用于解决无人机三维路径规划问题.该算法在迭代过程中加入了Levy飞行对最优解进行随机扰动;引入了信息交流机制,通过当前全局最优解和个体记忆最优解以及邻域最优解来更新个体的位置,能够更好地权衡局部收敛和全局开发.仿真结果表明,所提路径规划算法可以有效避开威胁区,收敛速度更快,收敛精度更高,且更不易陷入局部最优解.当迭代次数为300次、种群个数为50时,LWOA算法求得的成本函数值是PSO算法的91.1%,是GWO算法的92.1%,是WOA算法的95.9%,航迹代价更小.

    三维路径规划启发式算法鲸鱼算法信息交流机制莱维飞行

    融合频率和通道卷积注意的脑电(EEG)情感识别

    柴冰李冬冬王喆高大启...
    312-318页
    查看更多>>摘要:现有的脑电(EEG)情感识别研究普遍采用神经网络和单一注意机制来学习情感特征,具有相对单一的特征表示.而神经科学研究表明,不同频率和电极通道的脑电信号对情感有不同的响应程度,因此文中提出了一种融合频率和电极通道卷积注意的方法,用于脑电情感识别.具体来说,首先将EEG信号分解到不同的频带上并提取相应的帧级特征,然后用预激活残差网络来学习深层次的脑电情感相关特征,同时在残差网络的每个预激活残差单元中都融入频率和电极通道卷积注意模块,以建模脑电信号的频率和电极通道信息,并生成脑电特征的最终注意表示.在DEAP和DREAMER数据集上的独立于受试者场景下的实验结果表明,所提出的卷积注意方法相比单一注意机制更有助于增强EEG信号中情感显著信息的导入,并且能产生更好的情感识别结果.

    脑电情感识别特征表示残差网络预激活残差单元频率和电极通道卷积注意