首页期刊导航|计算机系统应用
期刊信息/Journal information
计算机系统应用
计算机系统应用

苏振泽

月刊

1003-3254

csa@iscas.ac.cn

010-62661041

100080

北京中关村南四街4号

计算机系统应用/Journal Computer Systems & ApplicationsCSCD北大核心CSTPCD
查看更多>>专业技术性刊物。推广计算机系统在各行各业的应用技术成果和运行管理经验。
正式出版
收录年代

    面向模糊医学图像边缘检测的卷积网络

    张陶界周迪斌李金迪余晨...
    198-206页
    查看更多>>摘要:考虑到传统边缘检测算法难以处理模糊的医学图像,提出一种基于深度学习的边缘检测网络ECENet.首先,本文网络基于CHRNet模型,对其最后两层进行剪枝,使模型更加高效和轻量化.其次,在网络的特征提取阶段加入注意力模块SKSAM,优化图像特征的自适应提取,并降低噪声的影响.最后,在多尺度的网络输出上采用上下文感知融合块进行连接,帮助模型更好地理解图像的结构和语义信息.此外,综合考虑像素级别的准确性和边界的平滑性,优化了损失函数,为模型训练提供更好的梯度信号.实验结果表明:本文算法在最佳数据集规模(ODS)和最佳图像比例(OIS)指标分别提高到0.816和0.823;相关边缘指标参数显著提高,PSNR提高了16.8%,SSIM提高了37.6%.

    深度学习边缘检测卷积神经网络注意力机制上下文感知融合块

    基于CNN跨层融合结构的边缘检测算法

    李金迪张陶界周迪斌刘文浩...
    207-215页
    查看更多>>摘要:传统边缘检测算法难以处理复杂的图像,而现有基于深度的边缘检测模型,其检测结果往往存在边缘定位错误和信息丢失等现象.针对此类问题,提出一种基于RCF的高精度的边缘检测算法RCF-CLF.首先,引入HDC结构设计用于避免因叠加相同膨胀卷积而引起的网格效应;其次,设计了一种特征增强结构,旨在融合多尺度信息、扩大感受野;然后,设计了跨层融合结构,将高层信息和低层信息融合,用于提取准确的边缘信息;最后,引入注意力机制CBAM,通过聚焦物体边缘区域,抑制非边缘区域,从而提高网络对边缘信息的提取能力.本文在BSDS500 和BIPED数据集上评估所提出的方法,与RCF算法相比,在BIPED数据集上,主要指标ODS、OIS和AP分别达到了 0.893、0.901 和 0.945,提高了近 5 个百分点,在BSDS500 数据集上,主要指标也有所提升.此外,与其他同类算法相比,本文算法也具有一定的优势,可以实现更加准确的边缘定位.

    边缘检测卷积神经网络特征增强跨层融合注意力机制

    基于改进YOLOv7的PDC钻头复合片检测

    陈琳国熊凌代啟亮王冬梅...
    216-223页
    查看更多>>摘要:复合片是PDC钻头的核心切削单元,复合片自动检测技术是复合片自动修复技术的基础.本文提出了一种基于改进YOLOv7 的PDC钻头复合片检测方法,在YOLOv7 的基础上,用深度可分离卷积替换了常规卷积,减少了参数量和运算成本;引入了SimAM注意力机制,不需要额外的参数便可以从神经元中推导出 3D注意力权重,而且还能提高卷积神经网络的表达能力;用SPPFCSPC替换了SPPCSPC,在保证感受野不变的同时获得了速度的提升;采用K-means++算法聚类先验框,使用启发式算法定位出缺损的复合片.实验结果表明,本文算法较原YOLOv7 模型mAP提高了 2.75%,参数量减少了约 80%,推理速度提高了 9.12 f/s,且较其他算法也有较大优势,可实现复合片检测的工业应用.

    PDC钻头复合片YOLOv7深度可分离卷积SimAM注意力机制SPPFCSPCK-means++

    多策略融合改进的蜣螂优化算法

    王乐遥顾磊
    224-231页
    查看更多>>摘要:针对标准蜣螂优化算法(DBO)存在的全局探索能力欠缺、收敛精度低及易陷入局部最优等不足,提出了一种融合多策略的改进蜣螂优化算法(MSDBO).首先,引入社会学习策略引导推球蜣螂进行位置更新,提高了算法全局探索能力,避免算法陷入局部最优;其次,提出一种方向跟随策略,建立起小偷蜣螂与推球蜣螂个体间的交互,提高了寻优精度;最后,引入环境感知概率,引导小偷蜣螂合理采用方向跟随策略,兼顾了性能与时间消耗.在 12 个基准测试函数上进行求解分析,并与其他优化算法进行对比,证明了MSDBO的寻优性能明显优于对比算法,在压力容器设计优化问题上的结果验证了MSDBO求解实际工程约束优化问题的有效性.

    蜣螂优化算法社会学习方向跟随环境感知概率基准测试函数压力容器设计

    无人机摄影测量点云道路自适应提取

    李威祥李武劲陈思源
    232-238页
    查看更多>>摘要:在无人机摄影测量中,针对传统的地面点云提取方法对图像点云数据中的道路提取适应性较差的问题,本文提出了一种无人机摄影测量点云道路自适应提取方法.首先,根据点云的空间几何特征将点云划分为 3 个类别;然后,针对非道路的点云类别采取相应的方法进行剔除;最后,对经过自适应提取方法得到的点云数据进行滤波平滑和基于颜色的区域生长分割处理.实验结果表明,该方法提取的道路点云的I类误差为 4.97%,II类误差为1.14%.该方法能够有效地提取目标道路路面,提高了无人机摄影测量工程应用中点云数据处理的效率.

    无人机摄影测量图像点云点云滤波点云分割道路提取

    求解多目标流水车间调度Pareto最优解的遗传强化算法

    刘宇陈永灿周艳平
    239-245页
    查看更多>>摘要:针对多目标流水车间调度Pareto最优问题,本文建立了以最大完工时间和最大拖延时间为优化目标的多目标流水车间调度问题模型,并设计了一种基于Q-learning的遗传强化学习算法求解该问题的Pareto最优解.该算法引入状态变量和动作变量,通过Q-learning算法获得初始种群,以提高初始解质量.在算法进化过程中,利用Q表指导变异操作,扩大局部搜索范围.采用Pareto快速非支配排序以及拥挤度计算提高解的质量以及多样性,逐步获得Pareto最优解.通过与遗传算法、NSGA-II算法和Q-learning算法进行对比实验,验证了改进后的遗传强化算法在求解多目标流水车间调度问题Pareto最优解的有效性.

    多目标流水车间调度Q-learning遗传算法Pareto

    基于改进UNETR++的肝脏分割

    马力王骏梁羡和郝金华...
    246-252页
    查看更多>>摘要:肝脏MRI影像的脂肪定量标准化过程中常需要对肝脏感兴趣区域进行手工采样,但手工采样策略耗时且结果多变.基于深度学习方法的全肝分割与手工勾勒的感兴趣区域在进行脂肪定量分析时,变异性误差和不确定性程度更低,性能更优越.在进行全肝分割任务时,为了提升分割性能,本文在UNETR++模型的基础上,进行改进.该方法融合卷积神经网络和Transformer结构各自的优点,增加卷积结构分支用于补足局部特征,同时引入门控注意力机制,抑制不相关的背景信息,使模型更为突出分割区域的显著特征.相比于UNETR++及其他分割模型,改进的方法具有更优的DCS及HD95 指标.

    全肝分割卷积神经网络门控注意力UNETR++

    基于传统方法与深度学习方法的图片相似度算法比较

    王华溢黄要诚蔡波
    253-264页
    查看更多>>摘要:图片相似度比对作为计算机视觉的一个研究方向,具有广泛的应用前景,例如人脸识别、行人重识别和目标跟踪等.然而,目前有关图片相似度算法的总结和归纳相对较少,并且将其应用在实际工业生产中也存在挑战.本文总结了传统图像处理算法和深度学习图像处理算法在图片相似度比对方面的原理与表现,旨在选取最佳的算法用于药品图片相似度比对的场景中.在传统图像处理算法中,ORB算法在测试集上表现最佳,准确率为 93.09%;在深度学习算法中,采用改进的孪生网络结构、发明了一种标签生成法、设置特定的数据增强策略并增加一个特征面分类网络,从而提高了训练效率和准确率.最终的测试结果显示,改进的孪生网络表现最佳,可以实现 98.56%的准确率和 27.80 次/s的推理速度.综上所述,采用改进的孪生网络算法更适用于药品图片的快速比对,并且有望在未来的医药行业中得到广泛应用.

    图片相似度算法传统图像处理深度学习孪生网络分类网络

    基于Efficient-YOLO的轻量化轴承缺陷检测

    娄瑶迪岳俊峰周迪斌刘文浩...
    265-275页
    查看更多>>摘要:针对现有深度模型在工业轴承外观缺陷检测领域,存在模型参数量大、特征融合不充分以及对小目标检测精度低等问题,提出了一种轻量化自适应特征融合检测网络(Efficient-YOLO).首先,该网络采用嵌入CBAM注意力机制的EfficientNetV2 结构进行基本特征提取,便于确保模型精度同时显著优化模型参数量;其次,设计了一种自适应特征融合网络(CBAM-BiFPN),用来增加网络对有效特征信息的提取;接着,在下游特征融合网络引入Swin Transformer机制,同时配合上游网络引入的Ghost卷积,大幅度提高模型对轴承外观缺陷的全局感知能力;最后,在推理阶段运用改进的非极大值抑制方法(Soft-CIoU-NMS),加入距离有关的权重评价因素,减少了重叠框的漏检.实验结果表明:与现有主流检测模型相比,此方法在轴承表面缺陷数据集上,mAP达到了 90.1%,参数量降低至 1.99M,计算量为7 GFLOPs,对轴承缺陷小目标识别率显著提升,满足工业现场轴承外观缺陷检测需求.

    轴承缺陷检测深度学习EfficientNetV2YOLOv5特征融合

    改进Wav2Lip的文本音频驱动人脸动画生成

    孙瑜朱欣娟
    276-283页
    查看更多>>摘要:为了提高中文唇音同步人脸动画视频的真实性,本文提出一种基于改进Wav2Lip模型的文本音频驱动人脸动画生成技术.首先,构建了一个中文唇音同步数据集,使用该数据集来预训练唇部判别器,使其判别中文唇音同步人脸动画更加准确.然后,在Wav2Lip模型中,引入文本特征,提升唇音时间同步性从而提高人脸动画视频的真实性.本文模型综合提取到的文本信息、音频信息和说话人面部信息,在预训练的唇部判别器和视频质量判别器的监督下,生成高真实感的唇音同步人脸动画视频.与ATVGnet模型和Wav2Lip模型的对比实验表明,本文模型生成的唇音同步人脸动画视频提升了唇形和音频之间的同步性,提高了人脸动画视频整体的真实感.本文成果为当前人脸动画生成需求提供一种解决方案.

    文本音频驱动人脸动画Wav2Lip模型动画生成