首页期刊导航|计算机科学
期刊信息/Journal information
计算机科学
计算机科学

朱完元

月刊

1002-137X

jsjkx12@163.com

023-63500828

401121

重庆市渝北区洪湖西路18号

计算机科学/Journal Computer ScienceCSCD北大核心CSTPCD
查看更多>>本刊的读者对象是:大专院校师生,从事计算机科学与技术领域的科研、生产人员。办刊宗旨是:坚持“双百”方针,活跃计算机科学与技术领域的学术气氛,重点报导国内外计算机科学与技术的发展动态,为我国的计算机科学与技术立于世界之林、达到国际先进水平奋斗而矢志不渝。
正式出版
收录年代

    基于骨骼关键点检测的多人行为识别

    李梦荷许宏吉石磊鑫赵文杰...
    138-143页
    查看更多>>摘要:人体行为识别(Human Activity Recognition,HAR)技术是计算机视觉领域的研究热点,目前多人HAR的研究仍存在很多技术难点.针对多人HAR中人数判断不准确、特征提取难度大导致行为识别准确率低的问题,提出了一种基于骨骼关键点检测的多人行为识别系统.该系统将骨骼点提取与动作识别相结合,首先对原始视频进行图像帧提取,然后通过OpenPose算法得到人体骨骼关键点数据来对人体进行检测并标注,最后根据骨骼点的特点提取人体姿态特征.同时,为准确描述特征之间的关系,提出了一种基于帧窗口矩阵的特征描述方法,该方法将支持向量机(Support Vector Machine,SVM)作为分类器以完成多人行为识别.选择UT-Interaction和HMDB51这两个公开的数据集中的10类日常典型行为作为测试对象,实验结果表明,所提方法可以有效提取图像中的多人骨骼关键点信息,且其对10类日常典型行为的平均识别准确率达86.25%,优于对比的其他已有方法.

    OpenPose算法骨骼关键点提取姿态特征提取SVM分类器

    基于颜色校正和去模糊的水下图像增强方法

    魏冬刘浩陈根龙宫晓蕙...
    144-150页
    查看更多>>摘要:由于光在水下传播时会出现吸收和散射的情况,水下图像往往存在色偏、对比度低、模糊、光照不均匀等问题.根据水下图像成像模型,人们在海底拍摄所获得的图像往往是退化的图像,而退化的图像不能完整地表达海洋场景信息,难以满足实际的应用需要.为此,文中提出了一种基于颜色校正和去模糊的水下图像增强方法.该方法有效融合了颜色校正和去模糊两个阶段,取得了递增的增强效果.在颜色校正阶段,首先对原始图像进行对比度拉伸,在对比度拉伸完成之后,图像可能存在拉伸过度或拉伸不足的现象.因此,所提方法根据灰度世界先验,在对比度拉伸后进一步使用伽马校正来优化和调整图像的对比度和色彩,使图像的R,G,B三通道的灰度值之和趋于相等.接着,在去模糊阶段,通过融合暗通道先验对颜色校正后的图像进行去模糊,得到最终的增强图像.实验结果表明,所提方法具有良好的整体恢复效果,能有效地恢复图像信息,在主观评价和客观评价上均展现出较好的效果.另外,所提方法可以作为水下图像分类等计算机视觉任务的预处理步骤,在实验中能够将水下图像集的分类精度提升16%左右.

    水下图像对比度拉伸颜色校正去模糊灰度世界图像分类

    基于BCNN的胎儿颅脑超声横切面识别算法

    束鑫常锋张歆杜睿...
    151-156页
    查看更多>>摘要:孕期超声检查是评估胎儿大脑发育、检测生长异常的重要步骤,开展对胎儿早期检查准确高效的诊断研究具有重要的临床价值.文中使用双线性卷积神经网络BCNN进行胎儿颅脑横切面识别,提出了BCNN-R和BCNN-S两种算法.BCNN算法首先对输入的胎儿颅脑超声影像数据进行预处理,去除个人信息等敏感信息;其次,利用两路并行的子网络从影像数据中提取辨识度高、鲁棒性强的横切面特征,并将其融合得到有助于识别的细微特征;最后使用线性连接层进行识别和分类.为了验证算法的有效性,在自建胎儿超声数据集JFU19上进行了对比实验,实验结果表明,所提算法相比常见的深度网络(GoogleNet,DenseNet,SeNet等)在分类性能上有明显的提升,其中BCNN-S算法的总体准确率达到了88.95%,BCNN-R在水平横切面的识别上达到了97.22%的精确度和88.61%的召回率.此外,在公开数据集HC18上进行了实验,BCNN算法的准确率、精确度、召回率分别达到了89.48%,87.66%和87.71%,进一步验证了算法的有效性.

    胎儿超声颅脑图像横切面识别深度学习BCNN

    联合自注意力和循环网络的图像标题生成

    王习张凯李军辉孔芳...
    157-163页
    查看更多>>摘要:目前大多数图像标题生成模型都是由一个基于卷积神经网络(Convolutional Neural Network,CNN)的图像编码器和一个基于循环神经网络(Recurrent Neural Network,RNN)的标题解码器组成.其中图像编码器用于提取图像的视觉特征,标题解码器基于视觉特征通过注意力机制来生成标题.然而,使用基于注意力机制的RNN的问题在于,解码端虽然可以对图像特征和标题交互的部分进行注意力建模,但是却忽略了标题内部交互作用的自我注意.因此,针对图像标题生成任务,文中提出了一种能同时结合循环网络和自注意力网络优点的模型.该模型一方面能够通过自注意力模型在统一的注意力区域内同时捕获模态内和模态间的相互作用,另一方面又保持了循环网络固有的优点.在MSCOCO数据集上的实验结果表明,CIDEr值从1.135提高到了1.166,所提方法能够有效提升图像标题生成的性能.

    图像标题自注意力机制循环神经网络

    白细胞图像超分辨率重建研究

    王伟胡涛李欣蔚沈思婉...
    164-168页
    查看更多>>摘要:近年来,计算机视觉已成为各类学科领域研究的重点,逐渐被应用于各类科研场景.医务工作者在临床上做血常规检验时,经常会采用血细胞图像分析系统对镜下白细胞图像进行自动计数与分类.其中,白细胞图像质量影响着血细胞分析系统计数分类的效果.针对镜下白细胞图像细节模糊的问题,文中尝试引入超分辨率方法对图片进行优化,以达到使白细胞图像更清晰的目的.所提出的方法在现有生成对抗网络的超分辨率方法(Super-Resolution Generative Adversarial Network,SRGAN)的基础上,设计引入嵌套型残差密集块(Residual-in-Residual Dense Block,RRDB)来改进网络结构,并对原有标准残差块中的批量规范化层进行删减,以提升网络性能,另外还对判别器的损失函数进行了改进.实验结果表明,该方法(SRGAN+)与3种插值法以及4种基于学习的超分辨率方法相比,在提高分辨率的同时,获得了图片细节更丰富、人眼视觉更优的图像.与SR-GAN方法相比,改进算法在峰值信噪比(Peak Signal-to-noise Ratio,PSNR)和结构相似度(Structural SIMilarity,SSIM)上分别有1.008 dB和1.07%的提高.

    白细胞图像超分辨率生成对抗网络嵌套型残差密集块

    基于语义对比生成对抗网络的高倍欠采MRI重建

    马凤飞蔺素珍刘峰王丽芳...
    169-173页
    查看更多>>摘要:利用数据的稀疏性从随机欠采样的K空间重建图像,是解决磁共振成像(Magnetic Resonance Imaging,MRI)因采集时间过长而应用受限问题的主要手段.然而,现有的方法重建高倍欠采图像时纹理细节丢失严重.针对这一问题,借鉴生成对抗网络的对抗学习思想,文中提出一种基于语义对比生成对抗网络的高倍欠采MRI重建方法(Semantic-Contrast Generative Adversarial Network,SC-GAN).该方法由连续的两部分组成.第一部分将笛卡尔高倍随机欠采样MRI图像输入基于U-NET的生成器,与鉴别器不断博弈对抗生成初步重建图像,以此构建重建子网;另一部分是语义对比子网,通过VGG-16比较初步重建图像与全采样图像的语义信息,比较结果反馈给第一部分进行参数调优,直到生成最佳的重建图像.实验结果表明,在加速因子高达7(14%)时,获得了主客观评价结果均较好的重建图像.与先进的重建方法相比,所提方法的内存损耗更低、收敛速度更快且纹理细节更丰富,可为下一代MRI机器的研发提供算法支持.

    MRI重建高倍欠采图像生成对抗网络语义对比稀疏性深度学习

    基于显著性特征和角度信息的遥感图像目标检测

    袁星星吴秦
    174-179页
    查看更多>>摘要:遥感图像中的目标具有密集性、多尺度和多角度等特性,这使得遥感图像多类别目标检测成为一项具有挑战性的课题.因此,文中提出了一种新的端到端的遥感图像目标检测框架.该框架通过提取显著性特征和不同卷积通道之间的相互关系来增强目标信息,抑制非目标信息,从而提高特征的表示能力.同时,在不增加模型参数的情况下,在卷积模块中添加多尺度特征模块来捕获更多的上下文信息.为了解决遥感图像中目标角度多变这一问题,该框架在区域建议网络中加入了角度信息,得到有角度的矩形候选框,并在训练过程中添加注意力损失函数来引导网络学习显著性特征.该框架在公开的遥感图像数据集上进行了相关验证,在水平任务框和方向任务框上的实验结果证明了所提方法的有效性.

    遥感图像目标检测多尺度特征通道自学习显著性学习

    多分辨率下资源感知的图像目标自适应缩放检测

    张开强蒋从锋程小兰贾刚勇...
    180-186页
    查看更多>>摘要:边缘视频处理可以降低云平台视频处理系统的视频传输时延、视频处理开销和存储成本,但是视频参数(分辨率、帧率等)的多样性容易导致边缘视频处理的效果不尽人意.通常,在图像预处理阶段会先对图像进行缩放变换再进行后续处理,以保障图像处理的最佳效果,但是在视频监控等具有不确定性的场景中对所有分辨率的图像直接成倍缩小容易降低目标检测率.基于以上问题,把图像水平像素点和垂直像素点的缩放倍数记作图像缩放因子,对于不同分辨率的视频数据,分析了图像缩放因子对视频数据处理效果的影响,提出了图像缩放因子动态设置方案.该方案以系统性能指标(服务器端系统功耗和内存使用率)为视频处理性能指标(人脸检测率)的约束条件,获取该分辨率下人脸检测率最优时对应的图像缩放因子.实验结果表明,对于不同分辨率的视频数据,图像缩放因子动态设置方案可以在保证视频处理性能的基础上,减少系统功耗和内存使用率,提高视频处理效率.

    边缘计算视频处理视频参数图像缩放人脸检测

    基于全U网络的混凝土路面裂缝检测算法

    瞿中谢钇
    187-191页
    查看更多>>摘要:针对现有的混凝土裂缝检测算法在各种复杂环境中检测精度不够、鲁棒性不强的问题,根据深度学习理论和U-net模型,提出一种全U型网络的裂缝检测算法.首先,依照原U-net模型路线构建网络;然后,在每个池化层后都进行一次上采样,恢复其在池化层之前的特征图规格,并将其与池化之前的卷积层进行融合,将融合之后的特征图作为新的融合层与原U-net网络上采样之后的网络层进行融合;最后,为了验证算法的有效性,在测试集中进行实验.结果表明,所提算法的平均精确率可达到83.48%,召回率为85.08%,F1为84.11%,相较于原U-net分别提升了1.48%,4.68%和3.29%,在复杂环境中也能提取完整裂缝,保证了裂缝检测的鲁棒性.

    裂缝检测U-net模型全U网络

    3D点云形状补全GAN

    赵新灿常寒星金仁标
    192-196页
    查看更多>>摘要:在真实的扫描环境中,由于视线遮挡或技术人员操作不当,实际采集到的点云模型会存在形状不完整的问题.点云模型的不完整性会对后续应用产生严重的影响,因此提出3D点云形状补全GAN用于完成点云模型的形状补全.该网络的点云重建部分由PointNet中用于数据对齐的T-Net结构与3D点云AutoEncoder网络相结合,来完成预测和填充缺失数据,识别器采用3D点云AutoEncoder中的Encoder部分对补全3D点云数据与真实的3D点云数据进行区分.最后,在ShapeNet数据集中训练上述网络结构,对所训练的网络模型进行验证并与其他基准方法进行定性比较.从实验结果可以看出,3D点云形状补全GAN可以将具有缺失数据的点云模型补全为完整的3D点云.在ShapeNet的3个子数据集chair,table以及bed上,相比基于3D点云AutoEncoder的方法,所提方法的F 1分数分别提高了3.0%,3.3%以及3.1%,相比基于体素3D-EPN的方法,所提方法的F 1分数分别提高了9.9%,5.8%以及4.3%.

    3D点云形状补全AutoEncoder生成对抗网络