首页期刊导航|工业控制计算机
期刊信息/Journal information
工业控制计算机
工业控制计算机

刘海青

月刊

1001-182X

ipcm_nj@163.com

025-85411811

210042

南京市龙蟠路173号江苏省计算技术研究所

工业控制计算机/Journal Industrial Control Computer
查看更多>> 本刊是中国计算机学会工业控制计算机专委会会刊,国际国内公开发行,国内刊号为:CN32-1764/TP,国际刊号为:ISSN 1001-182X,订阅代号为:28-60,月刊,定价8.00元。本刊是《中国学术期刊综合评价数据库》来源期刊,由《中国期刊网》、《中国学术期刊(光盘版)》、《中国核心期刊(遴选)数据库》全文收录。自1988年创刊至今,始终坚持科研与生产相结合,关注工业自动化领域的最新技术与应用,为建立工控厂商与用户之间的良好沟通渠道而不懈努力。 经过10余年的建设,读者群涵盖电力、机械、石化、冶金、交通、通信、水利、轻工、医药、环保、智能建筑、仪器仪表等多个领域,成为国内知名的专业技术期刊之一,得到了广大工控、自动化界人士的认可。 随着数字化、智能化的发展,企业信息化的需要,以及计算机技术在各个领域的应用日益深入,我刊将发挥更大的影响。
正式出版
收录年代

    一款学习型游戏设计与制作

    段永良刘敏
    111-114页
    查看更多>>摘要:以音视频系统为例,设计制作出一款基于音视频系统的学习型卡牌游戏,游戏将Unity 3D游戏引擎作为开发工具,C sharp作为开发语言.游戏中使用了 UGUI绘制主菜单及相关界面,以不同Button按钮实现不同界面和不同场景之间的切换,编辑不同动画及音效,为玩家营造一种欢快、轻松的游戏环境.通过卡牌游戏学习知识,相较于一般单纯的课本学习,能够有效提高人们的学习效率,增强学习热情和主动性.

    Unity3D卡牌游戏学习知识Csharp

    多尺度距离注意力纹理图像修复网络

    冯梦飞冯国瑞张新鹏
    115-116,119页
    查看更多>>摘要:随着图像修复技术的发展,现有的图像修复方法在平坦图像上的修复表现良好,然而针对于复杂纹理图像的修复效果不佳.为了解决这个问题,得益于卷积神经网络处理纹理信息的强大能力,提出了一种多尺度距离注意力图像修复网络(MDAN),该网络构建了一个对称型的注意力结构来生成合适的特征.采用交互注意力机制将多头注意力各个头之间联系起来,并且引入了多距离融合的距离先验.在特征匹配的过程中不仅考虑特征是否相似,还考虑特征间距离的影响.在公开数据集DTD上进行实验,MDAN模型的效果优于当前主流的方法.

    图像修复距离注意力深度学习纹理图像

    基于YOLOv5算法的圆心定位方法

    肖钦峰魏东刘波莫永迪...
    117-119页
    查看更多>>摘要:准确地获取图像中圆形目标的圆心是目标识别和定位中的关键问题.目前圆心定位主要采用最小二乘拟合圆以及HOUGH变换方法,但这些方法在不同程度上存在着鲁棒性不强、对环境光线要求高、需提前调试参数确定阈值、复杂背景下效果急剧变差等局限性.针对该问题,提出一种综合运用YOLOv5算法、Grabcut算法和灰度质心法进行图像分类、图像分割和灰度重心算法求取圆心坐标.该方法使用YOLOv5对图像中的圆形目标进行粗定位,再通过图像分割方法分割出圆形目标,最后使用加权型的灰度重心算法准确定位出圆心坐标,实现对圆形标志的可靠定位.用多个实验比较了该算法与现有算法的精度和稳定性,实验表明,该算法与现有算法相比,在干扰及形变的情况下圆心定位平均相对误差保持在0.5 pixel以内,而在干扰、强形变及目标残缺的情况下仍能保持在7 pixel以内,该算法不仅提高了圆形目标圆心检测的鲁棒性和准确性,而且具有良好的抗干扰性.

    圆心定位YOLOv5算法图像分割灰度质心法

    基于时空解耦Transformer的视频字幕去除算法

    涂奕飞蔡非凡王超丁友东...
    120-122页
    查看更多>>摘要:视频字幕在传递信息的同时,固化在视频中的字幕也阻碍了视频的重复利用.提出一种基于时空解耦Trans-former 的视频 字幕去除算法,能够从带有字幕文本的视频序列中 去除字幕文本,并重建出被字幕区 域遮挡的背景 图像.整体框架分为两个部分,字幕掩膜提取模块和字幕去除模块,前者快速精准地获得输入视频序列的二值字幕掩膜,将得到的二值字幕掩膜作为辅助信息,输入到基于时空解耦Transformer的字幕去除模块,进行字幕文本的去除和背景纹理的恢复,实现对整体视频字幕的去除.与现有的经典视频字幕去除方法相比,在峰值信噪比和结构相异性等图像质量指标以及视觉效果上,该方法均取得了更好的性能,实验结果验证了该方法在视频字幕去除领域的有效性.

    视频去字幕深度学习Transformer注意力机制

    一种基于强化学习的车辆语义分割方法

    苑佳男徐野
    123-125页
    查看更多>>摘要:准确高效的语义分割是自动驾驶、人机交互和机器人视觉应用的基本任务.由于在复杂的场景下,传统分割方法可能会出现难以处理的情况,例如无法很好地处理复杂的背景和噪声,需要手动调节参数来适应不同的图像场景导致大量的人力和时间成本.强化学习方法可以通过与环境进行交互学习,自主发现图像特征和规律,减轻噪声和复杂背景等因素对图像分割的影响,减少对人工特征工程的依赖.因此,采用基于滑动窗口的分割方法并引入强化学习,实现对道路场景下车辆的分割.在该方法下,机器人通过自主学习,提高了车辆分割的精度与平均交并比.

    强化学习语义分割决策树滑动窗口

    基于图像区域和骨架特征的条形码印刷缺陷检测算法

    胡丹黄辉
    126-128,131页
    查看更多>>摘要:条形码广泛用于商品的流通,为提高条形码质检的准确性和效率,提出了基于图像区域特征和骨架特征的条形码印刷缺陷检测算法.相机采集条形码图像后,利用模板匹配定位条形码,按照仿射变换参数进行图像矫正;然后,通过阈值分割、连通域、闭运算等处理,得到条码ROI待检区域;最后,利用区域最小外接矩形长度特征、区域矩形度特征、骨架特征先后检测条符,识别缺陷位置并存入新区域.生产现场测试表明,该方案的检测成功率为99.2%,平均耗时51.982 ms;实验仿真数据还验证所提算法适用不同角度的图像.与其他方法相比,该算法在识别精度、运行速度和鲁棒性方面均具有优势,能获得较好的检测效果.

    缺陷识别区域特征骨架特征EAN-13条码

    基于无监督学习的动作捕捉躯干弯曲度估计方法

    王传传朱良梅高婕胡必波...
    129-131页
    查看更多>>摘要:人体姿态估计是行为识别的研究热点,基于深度学习的人体运动捕捉技术是人体姿态估计的重要方法.然而,基于骨骼模型的研究,通常使用二维的人体姿态估计,在人体中间部位缺少胸部、骨盆、脊柱等关键点,大部分方法只包含人体中间部分有限的关键点.由于人体整体结构的复杂性,跟踪方法只估计人体表面,估计躯干内部的弯曲度较困难.通过在基于骨架的模型中添加新的关键点来优化现有的深度学习模型,并提出一种基于无标记动作骨架的曲线弯曲算法来估计躯干的弯曲度.借助惯性测量智能套装,用惯性测量法对该方法进行验证,该方法能够较好地估计出人体躯干弯曲度.实验表明,无标记的躯干弯曲估计模型,为进一步提高人体估计姿态的躯干弯曲精度提供新的研究思路.

    运动捕捉姿势估计躯干弯曲无监督学习

    基于样本的VVC无损帧内梯度预测算法

    陈国捷
    132-133页
    查看更多>>摘要:为了进一步提升VVC无损帧内编码的性能,在BDPCM编码工具的基础上,利用样本之间的关系,对其进行改进,提出了一种基于样本的梯度预测(Sample-based Gradient Prediction,SGP)算法.在该算法中,预测样本由对应预测方向上的相邻参考样本,以及参考样本之间的梯度信息获得,获得的预测样本被限制在一定范围内.在VVC测试模型(VTM)12.3上的实验结果表明,提出的SGP算法在VVC无损帧内编码中平均节省了 5.30%的比特率,编码时间增加了17.7%,解码时间下降了 19.5%.相较于BDPCM可以达到的3.88%平均比特率节省,SGP所带来的比特率节省大幅度提升,并且编码时间和解码时间都更短.

    图像编码无损压缩帧内预测梯度预测通用视频编码(VVC)

    基于全尺度融合侧输出残差网络的骨架提取算法

    莫莉莎王斌
    134-135,169页
    查看更多>>摘要:图像骨架是一种紧凑、直观的图像表示方法.目前,现有基于深度学习的二值像素图像骨架提取算法存在骨架断裂问题.提出了一种基于全尺度融合侧输出残差Unet网络(FFSR-Unet)的骨架提取算法,该算法通过融合编码器和解码器不同层级间的特征,实现了前景对象不同形状尺度的特征交互,同时采用阶梯式残差块以增强网络对深层与浅层语义的提取能力.该算法在Pixel SkelNetOn Challenge数据集上的F1-score可以达到0.854 8,能够超越现有算法的提取结果.

    骨架提取深度学习二值像素图像全尺度融合

    基于DNN-NKDE的公交车驻站时间概率区间预测

    刘文达郑国荣
    136-138,144页
    查看更多>>摘要:针对公交车在站台驻站时间的影响因素分析,考虑在复杂的乘车模式下引入驻站时间概率区间预测的概念.通过DNN算法构建驻站时间预测模型得到预测结果,统计预测值与真实值的误差集并划分为多个子区段,对每个子区段采用非参数核密度估计算法构建概率区间预测模型,估计重组各子区段在某置信水平下的公交车驻站时间概率区间预测结果.利用济宁市公交车到离站等信息数据,验证方法的有效性和可行性.

    概率区间预测非参数核密度估计公交驻站时间区段划分