首页期刊导航|现代计算机
期刊信息/Journal information
现代计算机
现代计算机

林楚昭

半月刊

1007-1423

lnzss@mail.sysu.edu.cn

020-84110804

510275

广州市海珠区新港西路135号中山大学园东区106栋西座1楼

现代计算机/Journal Modern Computer
查看更多>>《现代计算机》于1985年创刊,由中山大学主管主办,是一本面向计算机全行业的综合性学术刊物,一直以来致力于营造一个融洽的学术交流平台,帮助读者对象在学业、事业上更上一层楼。现为中国学术期刊综合评价数据库统计源期刊,中国期刊全文数据库全文收录期刊,中国核心期刊(遴选)数据库收录期刊,中国学术期刊(光盘版)收录期刊,全文入编中国学术期刊(光盘版)、中国期刊网、中华期刊网和中文科技期刊数据库、万方-数字化期刊数据库。
正式出版
收录年代

    基于改进YOLOv4的道路病害实时检测模型

    黄艳国李罗曾东红王丽宁...
    1-8,37页
    查看更多>>摘要:针对道路中存在多类、尺度不一的病害类型导致其检测精度低、检测速率慢以及漏检等问题,提出一种基于改进YOLOv4的道路病害实时检测模型.在网络模型中,首先优化卷积块中的归一化方式,采用组归一化来代替批量归一化,避免因Batch Size过小而导致检测效果不佳的情况发生;同时对卷积块进行优化,使用深度可分离卷积块来替代原有卷积块,量化网络模型的参数计算量,提高检测速度;最后在检测头中使用自适应非极大值抑制算法,解决非极大值抑制固定阈值引起的小目标漏检和误检问题.实验结果表明,改进后的YOLOv4算法在道路病害检测的检测精度mAP值高达88.64%,检测速度可达37.90帧/秒;与原YOLOv4算法相比,改进后的算法在检测精度上提高了2.89个百分点,同比检测速度增加了10.60帧/秒,且有效解决了漏检现象,进一步提高了在道路病害检测中的实用性.

    道路病害检测YOLOv4组归一化深度可分离卷积自适应非极大值抑制

    基于信息熵的二维局部二值模式静脉识别

    张云飞李江美陈熙
    9-16,61页
    查看更多>>摘要:基于现有LBP算法及其变体无法提取图像高维特征的问题,提出一种基于信息熵的二维局部二值模式识别算法.此方法首先利用统一局部二值模式(ULBP)对图像进行低维特征的提取,随后将图像信息熵与统一局部二值模式图谱进行结合获取熵值加权的统一局部二值模式图谱(EULBP),并利用滑动窗口实现对局部区域内模式间共现特征信息的统计,以其结果作为图像特征表达.并以直方图交叉距离为基础构建模式分类器,验证其识别性能.实验结果表明,在SDUMLA-HMT数据集以及马来西亚理工大学指静脉数据集(FV-USM)中,提出的算法能取得99.94%和98.84%的平均识别率.

    二维共现局部二值模式信息熵旋转不变方向特征

    基于改进YOLOv7-Tiny的高速公路入口两轮车辆闯入检测

    王宏田恬
    17-23页
    查看更多>>摘要:近年来,浙江、福建等省区相继出台相关地方性法规,禁止两轮车辆(摩托车、电动车等)通行高速公路.针对高速公路入口工作人员难以实时检测到两轮车辆闯入的问题,提出一种改进YOLOv7-Tiny的两轮车辆闯入检测算法.首先,从VOC2005中提取摩托车图片并增补了带有入口背景的图片后形成新数据集;其次基于YOLOv7-tiny,引入ECA注意力机制,使模型更加聚焦训练摩托车相关目标特征.使用ssFPN网络,对小目标特征信息进行增强;采用基于动态非单调机制的WIoU损失函数,提高对于小物体检测的准确性;使用Adam优化器,提升回归过程的收敛速度和准确性.改进后的算法,mAP、Precision、Recall分别提高了2.63、4.01、13.92个百分点,F1提高0.10,表明该方法具有显著的有效性.

    两轮车辆闯入检测YOLOv7-tinyECA注意力机制ssFPNWIoU

    基于FPGA的语义分割算法设计与实现

    汤镇铭陶青川
    24-30页
    查看更多>>摘要:为解决边缘端水利检测场景中水面情况复杂且具有实时性要求的问题,对BiSeNet网络进行了改进,得到了一种基于FPGA边缘设备的轻量化的实时语义分割算法.该算法通过Vitis AI对模型进行量化、Vitis软件平台软硬件协同优化设计定制了深度学习处理单元DPU,实现了基于FPGA的语义分割算法的部署.在自制水利数据集上保持较低精度损失的同时实现了良好的性能,实验结果表明,改进后的网络模型在精度上损失3.7%的情况下,在ZCU104设备上实现了31.06 FPS的推理速度,相对于ARM设备获得了18.9倍的加速推理效果.所提出的方法能够满足低功耗需求下实时水利场景分割任务的要求.

    深度学习语义分割FPGABiSeNetDPU

    基于改进YOLOv5的车辆检测方法研究

    赵月爱王哲
    31-37页
    查看更多>>摘要:基于YOLOv5s对交通道路上前方车辆的检测进行了研究,为提高车辆检测精度,对原YOLOv5s网络模型进行了改进.首先,将Mish激活函数应用于YOLOv5s模型之中代替原有的ReLU函数,使用更平滑的Mish激活函数有效避免梯度消失的问题.其次,采用BiFPN作为特征金字塔,增加了特征传递的信息通道,提升模型的感知能力和上下文信息的关联能力.最后,引入EIoU作为损失函数的一部分,准确地表示预测框和真实框之间的位置关系,间接地使收敛速度提升.在D2-City数据集上的实验表明,改进后的YOLOv5s平均精度mAP0.5为84.2%,比原始YOLOv5s算法提升了2个百分点.

    YOLOv5s车辆检测MishBiFPNEIoU

    基于Transformer的PM2.5浓度预测方法

    叶耀严华
    38-43页
    查看更多>>摘要:在深度学习领域中,通常采用循环神经网络(RNN)等方法对PM2.5的浓度进行预测研究,但传统方法在捕捉多站点数据之间的时空相关性方面存在一定困难.为了解决这一问题,基于Transformer网络模型对PM2.5浓度数据预测进行研究.Transformer采用多头自注意力机制,能够更好地捕捉PM2.5浓度的时空依赖性.其通过模型中编码器提取特征信息,通过模型中解码器处理特征中的依赖关系,输出未来时刻的PM2.5浓度,在真实数据集上的实验表明,Trans-former网络模型具备更好的预测能力.

    PM2.5Transformer时空相关性深度学习

    基于深度学习的对抗攻击发展研究

    卢彦利石雪莹刘光晓柳雪飞...
    44-49页
    查看更多>>摘要:随着深度学习在各领域的广泛应用,对抗攻击问题引起学术界与工业界的关注.首先概述了对抗攻击的背景,包括对抗攻击的定义、分类以及与传统的机器学习安全问题的区别.然后讨论了对抗样本生成及攻击策略,以及白盒攻击和黑盒攻击等攻击手段.最后总结了对抗攻击的意义,并展望未来研究方向,期待通过研究和探索提高深度学习模型的安全性和可靠性.

    深度学习对抗攻击数据攻击模型攻击防御策略

    一种用于医学图像分割的混合卷积网络

    张眉芳李其铿谢隆腾
    50-55页
    查看更多>>摘要:从医学图像中鲁棒性地分割器官是医学图像分析用于疾病诊断的关键技术之一.U-Net是一种用于医学图像分割的鲁棒结构.然而,U-Net采用连续的下采样编码器来捕捉多尺度特征,高层语义特征恢复不足,从而导致上下文信息丢失,无法充分恢复待分割器官特征.对编码器难以捕捉多尺度特征、高层语义特征恢复不足导致上下文信息丢失进行研究,提出了一种新的混合卷积网络来捕捉更多的上下文信息和高级语义特征.混合卷积网络的主要思想是利用提出的混合卷积连接模块从特征编码器提取更多的上下文信息和高级语义特征.多尺度特征提取模块用于连接编码器和解码器子网络,以获得更丰富的多尺度特征图.将提出的方法与最先进的方法在CHASEDB数据集和FRSA数据集上进行了比较.实验结果表明,提出方法的分割效果优于其他分割方法.

    医学图像分割混合卷积多尺度特征上下文信息

    基于多尺度注意力机制的单幅图像超分辨率重建

    阿火黄军严华
    56-61页
    查看更多>>摘要:近年来,深度卷积神经网络(CNN)在单幅图像超分辨率重建中取得了明显的进展.在此基础上,提出了一个校准多尺度通道空间注意网络(CMCSAN).CMCSAN由两个关键模块组成:校准多尺度模块(CMSM)和通道空间注意模块(CSAM).CMSM从不同尺度提取特征信息,自适应调整信息特征;CSAM模块可以自动鉴别不同通道的特征信息,有效调整空间的位置权重.实验结果表明,CMCSAN显著增强了挖掘中间特征信息的能力,在单幅图像超分辨率重建中表现出良好的性能.

    单幅图像校准多尺度模块通道空间注意模块超分辨率重建

    基于YOLOv5算法的学生课堂行为识别研究

    马瑞珵陈继王炳怀龙俊丞...
    62-65,71页
    查看更多>>摘要:随着智慧课堂和教育大数据挖掘的普及,创建一种智慧课堂中学生学习数据的自动检测和分析方法成为可能.基于YOLOv5模型实现两类学习数据:班级同学计数、学习行为识别.该模型对低头写字、低头看书、抬头听课、转头、举手、站立、小组讨论七种学生课堂行为进行识别,以此辅助教师判断学生学习情况并做出教学决策.研究表明,检测结果精确度达到97.92%.

    学生行为识别YOLOv5计算机视觉技术