首页期刊导航|浙江大学学报(工学版)
期刊信息/Journal information
浙江大学学报(工学版)
浙江大学学报(工学版)

岑可法

月刊

1008-973X

xbgkb@zju.edu.cn

0571-87952273

310027

杭州市浙大路38号

浙江大学学报(工学版)/Journal Journal of Zhejiang University(Engineering Science)CSCD北大核心CSTPCDEI
查看更多>>本学报的前身是浙江大学学报(自然科学版),四校合并后,为了突出浙江大学的工科优势,改为浙江大学学报工学版,稿源主要来之于本校教师、学生、研究所的科研工作者。刊登内容包括计算机科学技术与工程,信电与电子工程,光电,工业控制,材料,化工,高分子,机械,电机,能源,土木建筑工程、力学、生物工程和生命科学、环境科学、食品工程、农业工程以及理科方面和交叉学科等方面的最新研究成果。
正式出版
收录年代

    基于改进YOLOv5s的无人机小目标检测算法

    宋耀莲王粲李大焱刘欣怡...
    2417-2426页
    查看更多>>摘要:为了解决传统目标检测算法对无人机(UAV)航拍小目标存在错漏检严重的问题,提出基于YOLOv5的无人机小目标检测算法FDB-YOLO。在YOLOv5的基础上增加小目标检测层,优化特征融合网络,充分利用网络浅层小目标细粒信息,提升网络感知能力;提出损失函数FPIoU,通过充分利用锚框的几何性质,采用四点位置偏置约束函数,优化锚框定位,加快损失函数收敛速度;采用结合注意力机制的动态目标检测头(DyHead),通过增加尺度、空间、任务感知提升算法检测能力;在特征提取部分引入双级路由注意力机制(BRA),通过有选择性地对相关区域进行计算,过滤无关区域,提升模型的检测精确度。实验证明,在VisDrone2019数据集上,本算法与YOLOv5s目标检测算法相比,精确率提升了3。7个百分点,召回率提升了5。1个百分点,mAP50增加了5。8个百分点,mAP50:95增加3。4个百分点,并且相比当前主流算法而言都有更加优秀的表现。

    无人机视角小目标检测层损失函数注意力机制YOLOv5

    基于动态位置编码和注意力增强的目标跟踪算法

    熊昌镇郭传玺王聪
    2427-2437页
    查看更多>>摘要:为了充分利用模板和搜索区域之间的位置信息以及提高融合特征的表征能力,提出使用动态位置编码和多域注意力特征增强的方法。在注意力模块内部嵌入带有卷积操作的位置编码模块,随注意力计算更新位置编码,提高自身空间结构信息的利用率。引入多域注意力增强模块,在空间维度上使用不同空洞率和步长的平行卷积进行采样,以应对不同大小的目标物,并聚合通道注意力增强后的特征。在解码器中加入空间域注意力增强模块,为预测头提供更精确的分类回归特征。本算法在GOT-10K数据集上的平均重叠度(AO)为73。9%;在Tracking-Net、UAV123和OTB100数据集上分别取得了82。7%、69。3%和70。9%的曲线下面积(AUC)。与主流算法的对比结果表明,融合了动态位置编码和通道、空间注意力增强的跟踪模型可以有效提升模板和搜索区域间的信息交互,提高跟踪的精度。

    transformer注意力机制目标跟踪模型位置编码孪生网络

    基于改进YOLOv5s的烟梗物料目标检测算法

    吕佳铭张峰罗亚波
    2438-2446页
    查看更多>>摘要:在烟草生产线中烟梗输送下落过程中,存在背景信息干扰、目标数量多且形状不一、目标堆叠、下落速度过快等问题,传统图像处理算法难以解决。提出基于改进YOLOv5s的烟梗物料目标检测算法。对YOLOv5s网络的骨干和头部进行优化改进,显著提高检测精度,大幅缩小模型大小;将骨干网络优化为RepViT-m1结构,以提高信息提取的效率;采用重参数化技术,以更好地捕捉目标的特征,提高检测的精确性;引入基于注意力机制的目标检测头Dynamic Head,使模型更专注于潜在的目标区域,进一步提高检测精度。实验结果表明:在自建的烟梗数据集上,相较于原YOLOv5s模型,改进YOLOv5s模型的mAP@0。50为96。1%,提高了5。8个百分点;mAP@0。50:0。95为94。7%,提高了5。7个百分点;模型大小为12。1 MB,减少了12。3%。模型可以为实时监控系统提供可靠且精确的支持。

    目标检测YOLOv5s烟梗检测RepViT重参数化注意力机制

    基于改进YOLOv7的复杂环境下苹果目标检测

    莫恒辉魏霖静
    2447-2458页
    查看更多>>摘要:采摘机器人在不稳定光照、果实多样性和树叶遮挡等复杂自然环境下识别苹果时,检测模型难以捕获关键特征,导致采摘效率和准确性较低。提出基于YOLOv7模型的针对复杂场景下苹果目标检测的改进算法。通过限制对比度自适应直方图均衡化算法增强苹果图像对比度,以减少背景干扰,增强目标轮廓清晰度;提出多尺度混合自适应注意力机制,通过特征解构与重构,协同整合空间和通道维度的注意力导向,优化多层次特征的长短距离建模,增强模型对苹果特征的提取能力与抗背景干扰能力;引入全维度动态卷积,通过精细化的注意力机制优化特征选择过程;增加检测头个数,解决小目标检测问题;采用Meta-ACON激活函数,优化特征提取过程中的关注度分配。结果表明,改进后的YOLOv7模型对苹果的平均检测准确率和召回率分别为85。7%、87。0%,相比于Faster R-CNN、SSD、YOLOv5、YOLOv7,平均检测精度分别提高了15。2、7。5、4。5、2。5个百分比,平均召回率分别提高了13。7、6。5、3。6、1。3个百分比。模型效果表现优异,为苹果生长监测及机械摘果研究提供了坚实的技术支撑。

    苹果目标检测YOLOv7注意力机制小目标检测激活函数Grad-CAM

    基于改进SegFormer的太阳能电池缺陷分割模型

    罗伟颜作涛关佳浩韩建...
    2459-2468页
    查看更多>>摘要:针对太阳能电池制造过程中影响寿命和效率的缺陷问题,提出基于改进SegFormer的多尺度缺陷分割模型EL-SegFormer。该模型专注于太阳能电池缺陷分割任务,为生产提供可靠的检测手段。在网络浅层引入轻量级调制模块,利用多头混合卷积提取不同尺度缺陷的特征信息,以固定尺度卷积和感受野,有效捕获网络早期局部信息。通过聚合方式融合头部提取的特征信息,以更准确地定位太阳能电池的各种缺陷。以分级编码器形式融合浅层到深层的多尺度上下文信息输入解码器。解码器采用轻量级多层感知机,整合不同层级的特征信息生成分割掩码。加载遍历模型,利用缺陷图像分割掩码和标签掩码计算平均交并比(MIoU)。实验结果表明,EL-Seg-Former模型参数仅为68。2 M,在Buerhop2018数据集上的MIoU达到67。60%,高于近年最先进模型的MIoU。所提出的模型在复杂太阳能电池缺陷分割任务上表现较好,展现出强大的应用前景。

    太阳能电池缺陷分割Transformer多头混合卷积聚合轻量级多层感知机

    基于改进YOLOv5s网络的绝缘子缺陷检测

    李运堂张坤李恒杰朱文凯...
    2469-2478,2499页
    查看更多>>摘要:针对现有目标检测算法在复杂背景下绝缘子缺陷检测中容易出现漏检、误检和检测效率低等问题,改进YOLOv5s网络以提高绝缘子缺陷检测精度和速度。采用K-means++聚类分析绝缘子数据集,确定网络预设锚框尺寸;利用Hard-Swish激活函数替换主干网络第3、5、7层卷积模块的SiLU激活函数,并添加卷积注意力机制(CBAM),提高网络泛化能力;在主干网络与颈部网络间的跳跃链接添加CBAM,增强图像特征提取能力;利用交叉卷积替换颈部网络特征融合模块的残差结构,减少网络参数,提高检测速度。实验结果表明:基于改进YOLOv5s网络的绝缘子缺陷检测精度和速度分别为88。6%和69。4帧/s,优于Faster R-CNN、YOLOv3、YOLOv4、常规YOLOv5s等主流网络,满足绝缘子缺陷检测要求。

    YOLOv5s绝缘子缺陷激活函数卷积注意力机制交叉卷积

    基于骨架线的地图建筑物形状分类方法

    禄小敏马犇闫浩文李蓬勃...
    2479-2488页
    查看更多>>摘要:基于模板匹配的建筑物形态识别方法容易受到局部特征干扰。为了提高建筑物形态识别和分类的精度,在继承传统模板匹配方法优势的基础上,引入最小二乘模板、骨架线及特征向量构建建筑物形状分类模型。通过构建建筑物最小二乘模板并提取其骨架线的方式克服建筑物细小凹陷与凸出对整体形态识别的影响;在此基础上,计算骨架线特征向量并利用其余弦相似度实现建筑物与模板的匹配,相似度最高的模板即被确定为建筑物形状分类结果。为了验证模型的适用性和有效性,实验采用4540个建筑物数据进行分类验证。结果表明,该模型分类精度较高,能有效解决局部特征对建筑物整体形状描述的干扰问题,为进一步的建筑物匹配及其综合评价操作打下基础。

    形状分类模板匹配骨架线特征向量余弦相似度

    多尺度上下文引导特征消除的古塔图像分类

    孟月波王博刘光辉
    2489-2499页
    查看更多>>摘要:针对古塔建筑图像分类任务中难以准确定位判别性特征以及复杂场景干扰的问题,提出多尺度上下文引导特征消除的分类方法。构建以MogaNet为核心的特征提取网络,结合多尺度的特征融合以充分挖掘图像信息;设计上下文信息提取器,利用网络的语义上下文来对齐和过滤更具判别性的局部特征,加强网络捕捉细节特征的能力;提出特征消除策略,抑制模糊类特征和背景噪声干扰,并设计损失函数来约束模糊类特征消除和分类预测;建立中国古塔建筑图像数据集,为细粒度图像分类领域内针对复杂背景和模糊边界的研究提供数据支撑。实验结果表明,所提方法在自建的古塔建筑数据集上达到了96。3%的准确率,并在CUB-200-2011、Stanford Cars和FGVC-Aircraft这3个细粒度数据集上分别达到了92。4%、95。3%和94。6%的准确率,优于其他对比算法,可以实现古塔建筑图像的精确分类。

    图像分类上下文信息特征消除深度学习特征融合

    用于多元时间序列预测的图神经网络模型

    张晗
    2500-2509页
    查看更多>>摘要:现有用于多元时序预测的图神经网络模型大多基于预定义图以静态的方式捕捉时序特征,缺少对于系统动态适应和对时序样本之间潜在动态关系的捕捉。提出用于多元时序预测的图神经网络模型(MTSGNN)。该模型在一个图学习模块中,采用数据驱动的方式学习时间序列数据的静态图和动态演化图,以捕捉时序样本之间的复杂关系。通过图交互模块实现静态图和动态图之间的信息交互,并使用卷积运算提取交互信息中的依赖关系。利用多层感知机对多元时序进行预测。实验结果表明,所提模型在6个真实的多元时间序列数据集上的预测效果显著优于当前最先进的方法,并且具有参数量较小、运算速度较快的优点。

    多元时间序列图神经网络静态图动态图图交互

    基于改进NSGA-Ⅱ的多目标车间物料配送方法

    詹燕陈洁雅江伟光鲁建厦...
    2510-2519页
    查看更多>>摘要:针对车间物料配送效率低的问题,建立以配送路径最短和时间窗惩罚值最小为目标的物料配送多目标优化模型,提出基于快速非支配排序遗传算法(NSGA-Ⅱ)的混合优化算法INSGA-Ⅱ。该算法采用密度峰值聚类(DPC)初始化种群,缩减问题规模;在NSGA-Ⅱ遗传操作阶段,采用差分进化(DE)算法,避免陷入局部最优;通过变异向量的差分操作与部分映射交叉加快迭代速度,同时提高种群多样性。通过求解不同基准函数与不同规模算例验证算法的有效性,结果表明,与传统NSGA-Ⅱ算法相比,改进算法具有更优帕累托前沿,同时算法结果的均匀性和多样性更好,求解时间更短。研究结果表明,新算法生成的结果更优;相比NSGA-Ⅱ算法、多目标粒子群算法(MOPSO),生成的总配送距离减少26。65%,总时间窗惩罚减少32。5%,能有效提高车间物料的配送效率。

    物料配送多目标优化密度峰值聚类非支配排序遗传差分进化