首页期刊导航|浙江大学学报(工学版)
期刊信息/Journal information
浙江大学学报(工学版)
浙江大学学报(工学版)

岑可法

月刊

1008-973X

xbgkb@zju.edu.cn

0571-87952273

310027

杭州市浙大路38号

浙江大学学报(工学版)/Journal Journal of Zhejiang University(Engineering Science)CSCD北大核心CSTPCDEI
查看更多>>本学报的前身是浙江大学学报(自然科学版),四校合并后,为了突出浙江大学的工科优势,改为浙江大学学报工学版,稿源主要来之于本校教师、学生、研究所的科研工作者。刊登内容包括计算机科学技术与工程,信电与电子工程,光电,工业控制,材料,化工,高分子,机械,电机,能源,土木建筑工程、力学、生物工程和生命科学、环境科学、食品工程、农业工程以及理科方面和交叉学科等方面的最新研究成果。
正式出版
收录年代

    文本生成图像研究综述

    曹寅秦俊平马千里孙昊...
    219-238页
    查看更多>>摘要:对文本生成图像任务进行综合评估和整理,根据生成图像的理念,将文本生成图像任务分为3大类:基于生成对抗网络架构生成图像、基于自回归模型架构生成图像、基于扩散模型架构生成图像。针对基于生成对抗网络架构的文本生成图像方法,按照改进的不同技术点归纳为6小类:采用多层次体系嵌套架构、注意力机制的应用、应用孪生网络、采用循环一致方法、深度融合文本特征和改进无条件模型。通过对不同方法的分析,总结并讨论了现有的文本生成图像方法通用评估指标和数据集。

    人工智能生成内容文本生成图像生成对抗网络自回归模型扩散模型

    基于迁移学习的交互时序数据可视化生成方法

    周姿含王叙萌陈为
    239-246页
    查看更多>>摘要:为了解决时序数据间分布不一致的问题,使模式分析更容易应用于其他数据,提出基于迁移学习的交互式时序数据可视化生成方法,将迁移成分分析应用于时序数据提取的特征。将用户在其中一个时序数据上的分析作为标签,在该源域上训练分类器并应用到多个目标域,对多个不同目标域的时序数据的模式进行批量推荐。通过真实的天气数据和轴承信号数据的2个案例分析和专家访谈,验证了利用该方法能够提高时序数据探索的效率,减少数据分布不一致问题带来的影响,体现该方法的有效性和实用性。

    交互式可视化生成迁移学习时序数据可视分析模式推荐

    基于动态采样对偶可变形网络的实时视频实例分割

    宋一然周千寓邵志文易冉...
    247-256页
    查看更多>>摘要:为了更好地利用视频帧中蕴含的时间信息,提升视频实例分割的推理速度,提出动态采样对偶可变形网络(DSDDN)。DSDDN使用动态采样策略,根据前、后帧的相似性调整采样策略。对于相似性高的帧,该方法跳过当前帧的推理过程,仅使用前帧分割进行简单迁移计算。对于相似性低的帧,该方法动态聚合时间跨度更大的视频帧作为输入,对当前帧进行信息增强。在Transformer结构里,该方法额外使用2个可变形操作,避免基于注意力的方法中的指数级计算量。提供精心设计的追踪头和损失函数,优化复杂的网络。在YouTube-VIS数据集上获得了39。1%的平均推理精度与40。2帧/s的推理速度,验证了提出的方法能够在实时视频分割任务上取得精度与推理速度的良好平衡。

    视频实时推理实例分割动态网络对偶可变形网络

    精度可控的边界表示模型网格生成

    曾铮贾晓红辛士庆严冬明...
    257-267页
    查看更多>>摘要:针对边界表示模型生成的面网格模型存在的误差大、分辨率高和不水密的问题,提出针对计算机辅助设计(CAD)实体模型的保精度网格生成算法。算法通过同步生成对齐共边点对保证网格的水密性;利用连续表征设计网格目标边长,以生成高精度、低分辨率的网格。与现有的开源网格生成软件相比,算法能用更少的网格面片数生成精度更高的网格,且网格质量与其相当。

    边界表示模型网格生成水密性精度优化网格分辨率优化

    基于不变学习的真实雾霾去除方法

    孟小哲冯钰新苏卓周凡...
    268-278页
    查看更多>>摘要:针对有监督去雾方法面临的质量干扰问题,提出基于不变学习的真实雾霾图像去除方法。该方法使用傅里叶特征变换将网络提取的特征线性化表示,针对线性化特征进行全局加权并求解协方差,去除特征之间的相关性。不变学习使网络更加关注特征与去雾图像之间的本质关系,可以使网络获得稳定的跨域特征。分析并解释了数据和所提出方法的不同作用。该方法既实现了对大气光散射模型的改进,又构建了适用于真实雾霾场景的新数据集。通过大量实验,验证了该方法在真实世界的良好去雾效果。

    图像去雾质量干扰不变学习特征相关

    基于场景流的可变速率动态点云压缩

    江照意邹文钦郑晟豪宋超...
    279-287,333页
    查看更多>>摘要:针对现有的动态点云压缩神经网络需要训练多个网络模型的问题,提出基于场景流的可变速率动态点云压缩网络框架。网络以原始动态点云为输入,利用场景流网络进行运动向量估计,在压缩运动向量和残差的同时,引入通道增益模块对隐向量通道进行评估和缩放,实现可变速率控制。通过综合考虑运动向量损失和率失真损失,设计新的联合训练损失函数,用来端到端地训练整个网络框架。为了解决动态点云数据集缺少真实运动信息标签的问题,基于AMASS数据集制作带有运动向量标签的人体数据集,用于网络的训练。实验结果显示,与现有的基于深度学习动态点云压缩方法相比,该方法的压缩比特率下降了几个数量级,与静态压缩网络单独处理每帧的重构效果相比,该方法有5%~10%的提升。

    动态点云压缩可变速率联合损失函数场景流网络

    基于广义重心坐标的多边形域Coons面片

    罗川疆李亚娟邓重阳
    288-293页
    查看更多>>摘要:为了提高曲面"补洞"效率,提出多边形域Coons面片,继承了构造双线性Coons面片的布尔和方法,是双线性Coons曲面在凸多边形域上的直接推广。利用双线性坐标改写双线性Coons面片,将参数域推广到凸多边形域,用凸多边形域上的广义重心坐标代替矩形域上的双线性坐标,构造多边形域Coons面片。理论推导和数值算例表明,所提的多边形域Coons面片具有边界插值性,构造简单,计算高效,能够部分解决"补洞"问题。

    Coons面片广义重心坐标多边形域补洞

    基于Trans-nightSeg的夜间道路场景语义分割方法

    李灿林张文娇邵志文马利庄...
    294-303页
    查看更多>>摘要:针对夜间道路场景图像亮度低及缺乏带标注的夜间道路场景语义分割数据集的问题,提出夜间道路场景语义分割方法Trans-nightSeg。使用TransCartoonGAN,将带标注的白天道路场景语义分割数据集Cityscapes转换为低光条件下的道路场景图像,两者共用同一个语义分割标注,丰富夜间道路场景数据集。将该结果和真实的道路场景数据集一并作为N-Refinenet的输入,N-Refinenet网络引入了低光图像自适应增强网络,提高夜间道路场景的语义分割性能。该网络采用深度可分离卷积替代普通的卷积,降低了计算量。实验结果表明,所提算法在Dark Zurich-test和Nighttime Driving-test数据集上的平均交并比(mIoU)分别达到56。0%和56。6%,优于其他的夜间道路场景语义分割算法。

    图像增强语义分割生成对抗网络(GAN)风格转换道路场景

    引入相量算子和流向算子的天鹰优化算法

    周玉裴泽宣王培崇陈博...
    304-316页
    查看更多>>摘要:针对天鹰优化算法搜索效率不足,容易陷入局部最优的缺点,提出多策略改进天鹰优化算法(MIAO)。引入广义正态分布优化算法(GNDO),将该算法得出的结果与天鹰优化算法第1阶段得出的结果进行比较,筛选出这2种优化算法下的最优值。该操作扩大了搜索空间,提高了解的质量。引入相量算子,将第2阶段变为自适应的非参数优化,提高算法的高维优化能力。针对天鹰优化算法在迭代后期存在种群多样性降低、局部开发能力不足的问题,在天鹰算法的第3阶段引入流向算子,使信息可以在每个个体间相互传递,提高种群信息的利用率,增强天鹰优化算法的开发性能。通过对16个测试函数寻优对比分析以及Wilcoxon秩和检验可知,MIAO的寻优能力和收敛速度都有较大的提升。为了验证MIAO算法的实用性和可行性,采用所提算法求解减速器设计问题,通过实际工程优化问题的实验对比分析可知,MIAO算法在处理现实优化问题上具有一定的优越性。

    天鹰优化算法广义正态分布优化算法相量算子流向算子测试函数Wilcoxon秩和检验

    基于Transformer的多模态级联文档布局分析网络

    温绍杰吴瑞刚冯超文刘英莉...
    317-324,369页
    查看更多>>摘要:针对现有方法在文本和图像模态的预训练目标上存在嵌入不对齐,文档图像采用基于卷积神经网络(CNN)的结构进行预处理,流程复杂,模型参数量大的问题,提出基于Transformer的多模态级联文档布局分析网络(MCOD-Net)。设计词块对齐嵌入模块(WAEM),实现文本和图像模态预训练目标的对齐嵌入,使用掩码语言建模(MLM)、掩码图像建模(MIM)和词块对齐(WPA)进行预训练,以促进模型在文本和图像模态上的表征学习能力。直接使用文档原始图像,用图像块的线性投影特征来表示文档图像,简化模型结构,减小了模型参数量。实验结果表明,所提模型在PubLayNet公开数据集上的平均精度均值(mAP)达到95。1%。相较于其他模型,整体性能提升了 2。5%,泛化能力突出,综合效果最优。

    文档布局分析词块对齐嵌入TransformerMCOD-Net模型