首页期刊导航|计算机系统应用
期刊信息/Journal information
计算机系统应用
计算机系统应用

苏振泽

月刊

1003-3254

csa@iscas.ac.cn

010-62661041

100080

北京中关村南四街4号

计算机系统应用/Journal Computer Systems & ApplicationsCSCD北大核心CSTPCD
查看更多>>专业技术性刊物。推广计算机系统在各行各业的应用技术成果和运行管理经验。
正式出版
收录年代

    基于多模态数据融合的飞行员注视区域分类

    段高乐王长元吴恭朴王红艳...
    1-14页
    查看更多>>摘要:为了解决图像采集过程中眼图消失和头部姿态估计不准确的问题,利用基于非接触式的眼部信息获取方法采集人脸图像,从单个图像帧中确定飞行员当前的注视方向.同时,针对现有网络忽略头部运动对视线造成遮挡所导致的分类效果不佳问题,结合人脸图像与头部姿态特征,通过改进的MobileViT模型提出一种用于飞行员注视区域分类的多模态数据融合网络.首先提出了多模态数据融合模块解决特征拼接过程中尺寸不平衡导致的过拟合问题,其次提出一种基于并行分支SE机制的逆残差块,充分利用网络浅层的空间和通道特征信息,并结合Transformer的全局注意力机制捕捉多尺度特征.最后,重新设计了Mobile Block结构,使用深度可分离卷积降低模型复杂度.利用自制数据集FlyGaze对新模型和主流基线模型进行对比,实验结果表明,PilotT模型对注视区域 0、3、4、5 的分类准确率均在 92%以上,且对人脸发生偏转的情况具有较强适应力.研究结果对提升飞行训练质量以及飞行员意图识别和疲劳评估具有实际应用价值.

    注视区域分类并行分支SE机制MobileViT多模态数据融合

    联合判别性外观和运动线索的行人多目标跟踪

    王军李迎春程勇
    15-26页
    查看更多>>摘要:在多目标跟踪任务中,外界噪声的干扰会导致传统方法的系统建模不可靠,从而降低目标位置预测的准确性;而密集人群引起的拥挤和遮挡问题则会严重影响目标外观的可靠性,导致错误的身份关联.为了解决这些问题,本文提出一种多目标跟踪算法Ecsort.该算法在传统运动预测的基础上,引入噪声补偿模块,降低噪声干扰引起的误差,提高位置预测的准确性.其次,引入特征相似度匹配模块,通过学习目标的判别性外观特征,并结合运动线索和判别性外观特征的优势,从而实现精确的身份关联.通过在多目标跟踪基准数据集上进行的大量实验结果表明,与基线模型相比,该方法在MOT17 测试集上的IDF1(ID F1 score)、HOTA(higher order tracking accuracy)、AssA(association accuracy)、DetA(detection accuracy)分别提高了 1.1%、0.5%、0.6%、0.3%,在MOT20 测试集上的IDF1、HOTA、AssA、DetA分别提高了2.3%、1.9%、3.4%、0.2%.

    多目标跟踪运动线索判别性外观特征噪声补偿数据关联

    优化双线性ResNet34的人脸表情识别

    吕军苌婉婷陈付龙王志伟...
    27-37页
    查看更多>>摘要:为了能够更准确且快速地识别人脸表情,提出了一种优化的基于ResNet34 网络的双线性结构(OBSR-Net)来进行人脸表情识别.OBSR-Net采用双线性网络结构作为整体框架,主干网络使用ResNet34 网络,通过平移不变的方式对局部成对特征交互进行建模,从而提取更加完整有效的特征,同时采用迁移学习的策略来降低人脸表情小样本图像数据集对深度学习方法的限制.此外,在训练过程中使用一种新的通用优化技术,即梯度集中.该方法通过将梯度向量集中到零均值来直接对梯度进行操作,可以看作是一种具有约束损失函数的投影梯度下降方法.OBSR-Net在Fer2013 和CK+两个公开数据集上进行实验,分别取得了 77.65%和 98.82%的识别准确率.实验结果表明,与其他先进的人脸表情识别方法相比,OBSR-Net表现出较强的竞争力.

    人脸表情识别深度学习双线性结构迁移学习ResNet34梯度集中

    边缘计算的安全挑战与解决方法综述

    温木奇温武少
    38-47页
    查看更多>>摘要:相比集中式的云计算框架,边缘计算在云中心和现场智能设备之间部署了额外的"边缘服务器",支持现场智能设备快速、高效地完成运算任务和事件处理.边缘计算系统中,现场智能设备数量庞大、边缘计算服务器繁杂,它们存储的数据敏感和私密性要求高.边缘计算系统的这些特点,给网络安全防护带来困难.解决边缘计算系统的信息和网络安全是边缘计算技术大规模产业化的关键.而由于边缘服务器设备和现场智能设备的计算能力、网络能力和存储能力的局限,传统的计算机网络安全技术不能完全满足要求.分析适合边缘计算系统的联邦学习、轻量加密、混淆与虚拟位置信息、匿名身份认证等有效的敏感数据保护技术,以及探讨人工智能和区块链等新技术在边缘计算防范恶意攻击的应用,助力边缘计算的产业化发展.

    边缘计算数据保护联邦学习区块链内生安全架构

    S-UNet:基于U-Net和LSTM的短临降水预报网络

    许梦杜景林刘蕊
    48-57页
    查看更多>>摘要:随着深度学习技术的发展,多数研究工作将短临降水预报视为雷达回波序列的预测任务.由于降水复杂性的非线性时空变换,现有的短临预报存在准确性低、外推时效短、难以应对复杂的非线性时空变换等缺点.为解决以上问题,本文基于U-Net和LSTM提出了S-UNet短临降水预报网络.首先本文提出了S-UNet layer(SL)模块,以帮助网络更好地提取雷达序列特征,构建时空变化的整体趋势,从而提高网络效率,增加网络的外推时长.其次,为更好地应对雷达回波的变形、积累和消散的复杂性,增强网络对复杂的空间关系的捕获能力和运动轨迹的模拟能力,本文基于LSTM构建了雷达特征模块radar feature(RF).最后,将SL模块和RF模块与U-Net框架结合,提出了S-UNet短临降水预报网络,并在KNMI数据集上实现了先进的性能.实验结果表明,在KNMI的NL-50和NL-20数据集上,本文所提的方法与主流方法相比,海德克技能得分和关键成功指数分别提高了 5.25%(6.57%)和 2.17%(4.75%),达到了 0.30(0.29)和 0.72(0.58);准确率提高了 2.10%(1.35%),达到了 0.80(0.80);假接受率降低了 4.27%(1.80%),达到了0.24(0.38).除此之外,本文通过消融实验证明了所提出模块及结合方法的有效性.

    短临降水预报U-NetLSTM深度学习雷达回波

    多尺度融合的轻量级钢材表面缺陷检测

    杨本臣李世熙金海波康洁...
    58-67页
    查看更多>>摘要:钢材表面缺陷的检测质量直接影响工业生产安全性和机器性能质量,现实工厂钢材质量把控受限于设备条件,在实现高精度强实时的检测效果仍面临着挑战.为了解决这一问题,提出一种多尺度融合的轻量级YOLOv8n检测算法.首先引入一种结合HGnetv2 与RepConv的轻量级多尺度融合主干网络(RepHGnetv2),提高Backbone的特征提取能力与泛化能力同时降低了模型的复杂度;在Head部分,利用ADown下采样模块替换原算法的普通卷积(Conv),降低计算量并提高语义保留能力;最后将原算法的Loss函数替换为SlideLoss,改善样本之间不平衡的问题.在NEU-DET数据集上进行消融与对比实验,改进算法与原算法相比,mAP@0.5 提升 6.7%,Precision提升9.3%,模型大小下降 25.5%,计算量下降了 17.2%,FPS也有一定的提升;并在VOC2012 数据集上进行了通用性对比实验,实验结果表明改进算法可以有效提高缺陷检测精度与效率,同时具有较好的通用性.

    钢材表面缺陷检测轻量级YOLOv8nRepHGnetv2ADownSlideLoss

    基于MCGAN模型的降水临近预报

    刘蕊杜景林许梦
    68-78页
    查看更多>>摘要:在降水临近预报领域中,现有基于深度学习的雷达回波外推方法存在一些缺点.在图像质量方面,预测图像模糊并缺乏小尺度细节,在预测精度方面,降水结果不够准确.本文提出了一个多尺度生成对抗(MCGAN)模型,该模型由多尺度卷积生成器和全卷积的判别器组成.生成器部分采用编码器-解码器架构,主要包含了多尺度卷积块和下采样门控单元.MCGAN模型使用动态时空变异性损失函数在生成对抗网络(GAN)框架下训练,以达到更精准和更清晰的回波强度和分布预测效果.模型的性能在上海市公共雷达数据集上进行了验证,与主流深度学习模型相比,本文所提模型在图像质量评估中的MSE指标上下降了 11.15%,在SSIM指标和PSNR指标上分别增加了8.99%、2.95%;在预测精度评估中,CSI指标、POD指标、HSS指标上平均提高了 11.92%、15.89%、9.01%,FAR指标平均降低了14.81%.此外,本文通过消融实验证明了MCGAN模型每个部件的作用.

    深度学习雷达回波外推降水临近预报多尺度生成对抗网络

    优化的协作多智能体强化学习架构

    刘玮程旭李浩源
    79-89页
    查看更多>>摘要:在现实环境中,许多任务需要多个智能体的协作来完成,然而智能体之间通常存在着通信受限和观察不完整的问题.深度多智能体强化学习(Deep-MARL)算法在解决这类具有挑战性的场景中表现出卓越的性能.其中QTRAN和QTRAN++是能够学习一类广泛的联合动作-价值函数的代表性方法,且同时具备强大的理论保证.然而,由于依赖于单一联合动作-价值估计量以及忽视了对智能体观察的预处理,使得QTRAN和QTRAN++的性能受到了影响.本文提出了一种称为OPTQTRAN的新算法,其在QTRAN和QTRAN++的性能基础上取得了显著的提升.首先,本文引入了一种双联合动作-价值估计量的结构,利用一个分解网络模块计算额外的联合动作-价值.为了确保准确计算联合动作-价值,本文设计了一个自适应网络模块,有效促进了值函数学习.此外,本文引入了一个多元网络结构,将智能体的观察分组到不同的单元中,以有效估计各智能体的效用函数.在广泛使用的StarCraft基准测试中进行的多场景实验表明,与最先进的多智能体强化学习方法相比,本文的方法表现出更卓越的性能.

    强化学习智能博弈多智能体强化学习智能体协作

    基于扩散与时频注意力的时间序列插补方法

    王槃曾倩欣杨欢
    90-100页
    查看更多>>摘要:时间序列插补旨在根据现有数据填补缺失值以恢复数据的完整性.目前基于RNN的插补方法存在较大的误差,并且增加网络层数容易出现梯度爆炸和消失问题,而基于GAN和VAE的插补方法经常面临训练困难和模式崩溃的挑战.为解决上述问题,本文提出了一种基于扩散与时频注意力的时间序列插补模型DTFA(diffusion model and time-frequency attention),通过反向扩散实现从高斯噪声中重建缺失数据.具体而言,本研究利用多尺度卷积模块与二维注意力机制捕获时域数据中的时间依赖性,并利用MLP与二维注意力机制学习频域数据的实部与虚部信息.此外,本研究通过线性插补模块以对现有的观测数据进行初步的数据增强,从而更好地指导模型的插补过程.最后,本研究通过最小化真实噪声与估计噪声的欧氏距离来训练噪声估计网络,并利用反向扩散实现对时序数据的缺失插补.本研究的实验结果表明,DTFA在ETTm1、WindPower和Electricity这 3 个公开数据集上的插补效果均优于近年主流的基线模型.

    时间序列插补扩散模型注意力机制线性插补多尺度卷积

    基于变形卷积和多重注意力的零售商品检测

    王添刘立波
    101-110页
    查看更多>>摘要:针对零售商品旋转和变形导致难以准确提取全局特征及无关特征干扰的问题,提出一种基于改进YOLOv8s的零售商品检测算法.首先,利用归一化可变形卷积替代部分标准卷积,通过充分捕获长距离依赖关系以及突出通道关键特征,增强对全局特征的提取能力;其次,使用改进的动态检测头,使用基于空间感知、尺度感知和任务感知的多重注意力机制来捕获更具区分性的商品局部特征,以抑制无关特征干扰;最后,采用InnerEIoU损失函数替换CIoU,以降低商品漏检率.实验结果表明,所提算法在RPC零售商品数据集上的mAP@0.5:0.95 达到 93.3%,较原始算法提升了 1.5%,并优于其他主流检测算法;同时模型参数量和计算量分别下降了 10.0%和 6.5%,能够在存储和计算资源受限的实际场景中,准确地进行零售商品检测.

    零售商品检测YOLOv8s可变形卷积轻量级注意力机制