首页期刊导航|计算机科学
期刊信息/Journal information
计算机科学
计算机科学

朱完元

月刊

1002-137X

jsjkx12@163.com

023-63500828

401121

重庆市渝北区洪湖西路18号

计算机科学/Journal Computer ScienceCSCD北大核心CSTPCD
查看更多>>本刊的读者对象是:大专院校师生,从事计算机科学与技术领域的科研、生产人员。办刊宗旨是:坚持“双百”方针,活跃计算机科学与技术领域的学术气氛,重点报导国内外计算机科学与技术的发展动态,为我国的计算机科学与技术立于世界之林、达到国际先进水平奋斗而矢志不渝。
正式出版
收录年代

    基于自然语言生成的制造企业自动化图表分析方法研究

    王旭刘昌宏李生春刘爽...
    174-181页
    查看更多>>摘要:随着数字化转型的浪潮席卷全球,制造企业每天都会产生大量的图表数据,传统的图表分析方法很难对图表数据进行高效、准确的分析,自动化图表分析方法成为图表分析的重要手段.为解决自动化图表分析方法在实际应用时很难满足具体需求的问题,提出了一种基于自然语言生成的制造企业自动化图表分析方法.该方法基于LSTM对图表数据进行分析,并针对分析过程中出现的多余数据误导LSTM等问题,在嵌入层之后增加判别器层使LSTM能够根据图表类型进行更有针对性的语义理解和文本预测;针对图表分析过程中生成描述语句质量差等问题,参考集束搜索和随机采样策略,提出随机集束采样策略以提高图表分析质量,并引入知识蒸馏方法对LSTM进行优化,进一步提高描述文本的质量.实验证明,相较于LSTM,该方法文本质量提升了 8.9%.为了便于将该方法应用在实际中,设计并开发了制造企业自动化图表分析系统,并将该方法引入作为图表分析工具.实验结果表明,所提方法能够提高制造企业图表分析的质量和效率.

    图表分析自然语言生成LSTM知识蒸馏

    基于fMRI时变特征的大脑状态研究综述

    林祺业夏佳楠周雪忠
    182-192页
    查看更多>>摘要:功能磁共振成像技术已被广泛应用于人脑功能活动的研究,使用大脑状态(Brain State)研究大脑动力学得到了研究人员的广泛关注.以往关于大脑状态的综述,通常从状态定义方法的角度进行比较和总结,忽略了底层数据形式的不一致,可能导致对大脑状态的解读多样化.此外,现有综述也缺少对大脑状态分析应用方法的探讨.基于不同的数据形式,回顾了大脑状态的不同定义方法,总结了基于大脑状态进行大脑动力学分析的不同方法,并从大脑状态应用于认知、精神疾病、生理状态等方面的研究,总结出典型的研究方法.最后,发现了大脑元状态的定义与深度学习在特征提取方面具有相似性,从而提出将深度学习应用于大脑状态的识别以及大脑动力学的研究,这是一个有希望的未来方向.

    大脑状态元状态动态功能连接大脑动力学大脑网络

    基于视觉的神经网络三维动态手势识别方法综述

    王瑞平吴士泓张美航王小平...
    193-208页
    查看更多>>摘要:动态手势识别作为一种重要的人机交互手段而受到广泛关注,其中基于视觉的识别方式因其使用便利性和低成本的优势成为新一代人机交互的首选技术.以人工神经网络为中心,综述了基于视觉的手势识别方法研究进展,分析了不同类型人工神经网络在手势识别中的发展现状,调研并归纳总结了待识别数据和训练数据集的类型及特点;此外,通过开展性能对比实验,客观评估了不同类型的人工神经网络,并对结果进行了分析.最后,对调研内容进行了总结,对该领域面临的挑战和存在的问题进行了阐述,对动态手势识别技术的发展趋势进行了展望.

    动态手势识别人机交互人工神经网络卷积神经网络循环神经网络注意力机制混合神经网络

    基于双流YOLOv4的金属表面缺陷检测方法

    徐浩李丰润陆璐
    209-216页
    查看更多>>摘要:目前有许多学者使用深度学习进行表面缺陷检测研究,由于这些研究大都沿用主流目标检测算法的思路,注重高级语义特征,而忽视了低级语义信息(色彩、形状)对表面缺陷检测的重要性,因此导致缺陷检测效果不够理想.为解决上述问题,提出了 一种金属表面缺陷检测网络——双流YOLOv4网络,骨干网络分成两个分支,输入分为高分辨率图像和低分辨率图像,浅分支负责从高分辨率图像中提取低级特征,深分支负责从低分辨率图像中提取高级特征,通过削减两分支的层数和通道数来减少模型总参数量;为了强化低级语义特征,提出了 一种树形多尺度融合方法(Tree-structured Multi-scale Feature Fusion Me-thod,TMFF),并设计了 一个结合极化自注意力机制和空间金字塔池化的特征融合模块(Feature Fusion Module with Polarized Self-Attention Mechanism and Spatial Pyramid Pooling,FFM-PSASPP)应用到 TMFF 中.在东北大学热轧带表面缺陷数据集NEU-DET、金属表面缺陷数据集GC10-DET和伊莱特电饭煲内胆缺陷数据集Enaiter的测试集上对所提算法进行了测试,测得的map@50结果分别为0.80,0.66和0.57,相比大部分主流的用于缺陷检测的 目标检测算法均有提升,且模型参数量仅为原YOLOv4的一半,速度与YOLOv4接近,可满足实际使用需求.

    金属表面缺陷检测目标检测YOLOv4双流骨干网络多尺度特征强化

    基于多任务学习的视频和图像显著目标检测方法

    刘泽宇刘建伟
    217-228页
    查看更多>>摘要:显著目标检测(Salient Object Detection,SOD)能够模拟人类的注意力机制,在复杂的场景中快速发现高价值的显著目标,为进一步的视觉理解任务奠定了基础.当前主流的图像显著目标检测方法通常基于DUTS-TR数据集进行训练,而视频显著目标检测方法(Video Salient Object Detection,VSOD)基于DAVIS,DAVSOD以及DUTS-TR数据集进行训练.图像和视频显著目标检测任务既有共性又有特性,因此需要部署独立的模型进行单独训练,这大大增加了运算资源和训练时间的开销.当前研究大多针对单个任务提出独立的解决方案,而缺少统一的图像和视频显著目标检测方法.针对上述问题,提出了一种基于多任务学习的图像和视频显著目标检测方法,旨在构建一种通用的模型框架,通过一次训练同时适配两种任务,并进一步弥合图像和视频显著目标检测方法之间的性能差异.12个数据集上的定性和定量实验结果表明,所提方法不仅能够同时适配两种任务,而且取得了比单任务模型更好的检测结果.

    视频显著目标检测图像显著目标检测多任务学习性能差异

    基于GAANET的立体匹配算法

    宋昊毛宽民朱洲
    229-235页
    查看更多>>摘要:端到端的立体匹配算法在计算时间和匹配效果上均有一定的优势,近年来在立体匹配任务中得到了广泛的应用.但特征提取的过程中存在特征冗余、信息丢失,以及多尺度特征融合不充分等问题,造成算法的计算量和复杂度偏高,也影响了匹配的精度.针对上述问题,在自适应聚合网络AANET的基础上,设计了更加适合立体匹配的特征提取模块,提出了改进的幽灵自适应聚合网络GAANET.采用G-Ghost阶段提取多尺度的特征,通过廉价操作生成部分特征,减少特征的冗余现象并有效保存浅层特征;采取高效的通道注意力机制,将不同的权重分配到每个通道中;采取改进的特征金字塔结构,缓解传统金字塔中的通道信息丢失并优化融合特征,为各个尺度的特征进行丰富的信息补充.在SceneFlow,KITT12015和KITTI2012数据集上进行训练和评估,评估结果显示,与基础方法相比,所提改进算法的精度分别提升了 0.92%,0.25%和0.20%,且参数量减少了 13.75%,计算量减少了 4.8%.

    立体匹配特征提取端到端立体匹配网络注意力模块深度学习

    基于3D骨架相似性的自适应移位图卷积神经网络人体行为识别算法

    闫文杰尹艺颖
    236-242页
    查看更多>>摘要:图卷积神经网络(Graph Convolutional Neural network,GCN)在基于3D骨架的人体行为识别领域取得了良好效果.然而,现有的大多数GCN方法对行为动作图的构建都是基于人体物理结构的手动设置,训练阶段各个图节点只能根据手动设置建立联系,无法感知动作行为过程中骨骼节点之间产生的新联系,导致图拓扑结构不合理和不灵活.移位图卷积网络通过改变图网络结构使得感受野更加灵活,并且在全局移位角度取得了良好效果.因此,提出了一种基于自适应移位图卷积神经网络(Adaptive Shift Graph Convolutional Neural network,AS-GCN)的人体行为识别算法来弥补前述 GCN 方法的不足.AS-GCN借鉴了移位图卷积网络的思想,提出用每个人体动作的本身特点来指导图神经网络进行移位操作,以尽可能准确地选定需要扩大感受野的节点.在基于骨架的通用动作识别数据集NTU-RGBD上,所提算法在骨骼有无物理关系约束的前提条件下均进行了实验验证.与现有的先进算法相比,AS-GCN算法的动作识别准确率在有骨骼物理约束的条件下的CV和CS角度上平均提高了 12%和4.84%;在无骨骼物理约束的条件下的CV和CS角度上平均提高了 20%和14.49%.

    骨架动作分类图卷积神经网络行为识别自适应移位

    结合卷积神经网络与多层感知机的渐进式多阶段图像去噪算法

    薛金强吴秦
    243-253页
    查看更多>>摘要:现有基于深度学习的图像去噪方法中,在网络架构层面存在单阶段网络特征表达能力不足而难以在复杂场景下重构清晰图像,以及多阶段网络内部特征连接不紧密而容易丢失原始图像细节的问题.在基础构建块层面,存在卷积层难以处理较大噪声级别下的跨层次特征,以及全连接层难以捕获图像邻域空间细节的问题.为解决以上问题,从两方面提出解决方法:一方面,在架构层面提出新颖的跨阶段门控特征融合,从而更好地连接一阶段网络的浅层特征与二阶段的深层特征,促进信息流的交互并使得去噪网络内部关联更为紧密,同时避免丢失原始像素细节;另一方面,在基础构建块层面提出结合卷积神经网络和多层感知机特性的双轴特征偏移块,作用于低分辨率多通道数的特征图,从而缓解卷积网络在复杂噪声场景下难以捕获跨层次特征依赖关系的问题,对于高分辨率、少通道数的特征图,使用卷积网络以充分提取噪声图像的空间邻域依赖关系.大量定量与定性实验表明,所提算法在真实世界图像去噪和高斯噪声去除任务中,都以较小的参数量和计算代价取得了最佳的PSNR和 SSIM.

    图像处理图像去噪深度学习卷积神经网络多层感知机特征融合

    基于快速最大奇异值幂正规化的全局协方差池化

    曾睿仁谢江涛李培华
    254-261页
    查看更多>>摘要:近期的研究工作表明,矩阵正规化对全局协方差池化起着关键作用,有助于生成分辨能力更强的表征,从而提升图像识别任务的性能.在不同的矩阵正规化方法中,矩阵结构正规化能充分利用协方差矩阵的几何结构,因此可以获得更好的性能.然而,结构正规化一般依赖计算代价很高的奇异值分解(SVD)或者特征值分解(EIG),不能充分利用GPU的并行计算能力,从而形成计算瓶颈.迭代矩阵平方根正规化(iSQRT)通过牛顿-舒尔兹迭代对协方差矩阵进行正规化,速度比基于SVD和EIG的方法更快.但是随着迭代次数和维度的提高,iSQRT的时间和内存开销都会显著增加,而且该方法无法完成一般幂次的正规化,限制了其应用范围.为了弥补iSQRT的不足,文中提出了一种基于最大奇异值幂的协方差矩阵正规化方法.该方法通过将协方差矩阵除以其最大奇异值的幂来实现,计算过程仅需迭代幂法计算矩阵的最大奇异值.详细的消融实验的结果表明,与iSQRT相比,所提方法的速度更快并占用更少的显存,在时间复杂度和空间复杂度上都优于iSQRT方法,同时性能上与iSQRT方法相当或更好.所提方法在大规模图像分类数据库和细粒度识别数据库中取得了领先的性能,其中在Aircraft,Cars和Indoor67上分别表现为90.7%,93.3%以及83.9%,充分验证了所提方法的鲁棒性和泛化性.

    图像分类全局协方差池化矩阵幂正规化最大奇异值幂正规化

    基于语音节奏差异的情感识别方法

    张家豪章昭辉严琦王鹏伟...
    262-269页
    查看更多>>摘要:语音情感识别在金融反欺诈等领域有着重要的应用前景,但是语音情感识别的准确率提升变得越来越困难.现有基于语谱图的语音情感识别等方法难以捕捉节奏差异特征,从而影响识别效果.文中基于语音节奏特征的差异性,提出了能量帧时频融合的语音情感识别方法.其关键是,针对语音中高能量区域进行频谱筛选,以高能语音帧的分布和时频变化来体现个体的语音节奏差异.在此基础上建立基于卷积神经网络(CNN)和循环神经网络(RNN)的情感识别模型,实现对频谱的时域和频域变化特征的提取与融合.在公开数据集IEMOCAP上进行实验,结果表明,该基于语音节奏差异的语音情感识别与基于语谱图的方法相比,在加权准确率WA和非加权准确率UA指标上分别平均提升了 1.05%和1.9%;同时也表明个体的语音节奏差异对提升语音情感识别效果具有重要作用.

    语音情感识别能量帧频域谱线时频融合语音节奏差异