首页期刊导航|计算机系统应用
期刊信息/Journal information
计算机系统应用
计算机系统应用

苏振泽

月刊

1003-3254

csa@iscas.ac.cn

010-62661041

100080

北京中关村南四街4号

计算机系统应用/Journal Computer Systems & ApplicationsCSCD北大核心CSTPCD
查看更多>>专业技术性刊物。推广计算机系统在各行各业的应用技术成果和运行管理经验。
正式出版
收录年代

    双注意力记忆多智能体强化学习

    马裕博周长东张志文杨培泽...
    115-122页
    查看更多>>摘要:多智能体协同在强化学习研究领域占据重要地位,旨在深入探讨智能体如何通过相互协作实现共同目标.大部分协作多智能体算法注重合作的构建,但忽略了个体策略的强化.为解决上述问题,本文提出一种BiTransformer记忆(BTM)在线强化学习模型,该模型不仅考虑多智能体之间的协同,还利用记忆模块辅助个体决策.BTM由双注意力编码器和双注意力解码器组成,分别用于个体策略的增强和多智能体系统的协作.在双注意力编码器中,受人类的决策经验依赖的启发,提出记忆注意力模块为当前决策提供历史决策经验.与传统利用RNN的方法不同,BTM为每一个提供的是一个显式历史决策经验库,而非隐藏单元.此外,提出融合注意力模块,在历史决策经验的辅助下处理当下的局部观测信息,从而获取环境中最具决策价值的信息,进一步提高智能体个体的决策能力.在双注意力解码器中,本文提出了决策注意力模块和合作注意力模块两个模块,通过综合考虑其他已经做出决策智能体与当前智能体的合作收益以及带有历史决策经验的局部观察,从而促进历史决策辅助下的多智能体潜在合作的形成.最终本文在星际争霸中的多个场景下对BTM进行了测试,取得了93%的平均胜率.

    多智能体协同在线强化学习局部观测历史决策经验合作收益个体策略增强

    深度残差频率自适应的DEM超分辨重建

    李智杰米德源李昌华张颉...
    123-130页
    查看更多>>摘要:目前超分辨率重建技术运用于诸多场景,但对于数字高程模型(digital elevation model,DEM)的重建存在许多挑战,针对无法充分利用DEM复杂地形特征导致的细节缺失和失真问题,提出了深度残差频率自适应的DEM超分辨重建模型,由多个高低频特征提取模块组成残差网络结构,提升对DEM特征的整体感知能力,并加入频率选择特征提取模块,增强对复杂地形特征的识别和捕捉能力,其次在模型中加入了空洞空间金字塔池化,通过融合多尺度信息,改善重建质量并充分保留地形特征的细节和结构,最终在梯度域和高度域双重约束下完成超分辨率重建.实验结果表明,在以两种精度的陕西秦岭高程图作为实验数据下,深度残差频率自适应DEM超分辨率模型相较于其他先进模型,在各个指标上均取得了提升,重建后的DEM细节更加丰富、纹理更加清晰.

    数字高程模型残差网络空洞空间金字塔池化超分辨率重建

    基于改进RT-DETR的水下目标检测

    张路魏本昌魏鸿奥周龙刚...
    131-140页
    查看更多>>摘要:水下目标检测技术在海洋探测中具有重要的现实意义.针对水下场景复杂,以及存在遮挡重叠导致目标特征提取有限的问题,提出了一种适用于水下目标检测的FERT-DETR网络.该模型首先提出了一种特征提取模块Faster-EMA,用于替换RT-DETR中ResNet18 的BasicBlock,能够在有效降低模型参数量和模型深度的同时,显著提升对水下目标的特征提取能力;其次在编码部分使用级联群体注意力模块AIFI-CGA,减少多头注意力中的计算冗余,提高注意力的多样性;最后使用高水平筛选特征金字塔HS-FPN替换CCFM,实现多层次融合,提高检测的准确性和鲁棒性.实验结果表明,所提算法FERT-DETR在URPC2020 数据集和DUO数据集上比RT-DETR检测准确率提高了 3.1%和 1.7%,参数量压缩了 14.7%,计算量减少了 9.2%,能够有效改善水下复杂环境中不同尺寸目标漏检、误检的问题.

    计算机视觉RT-DETRFasterNet注意力机制高水平筛选特征金字塔

    改进YOLOv8n-Pose的形变QR码校正与识别

    刘云邹复民蔡祈钦李俊清...
    141-152页
    查看更多>>摘要:针对QR码图像检测过程中因环境复杂性和拍摄角度变化等因素导致QR码读取率低的问题,本文提出一种基于改进YOLOv8n-Pose的形变QR码校正与识别算法.首先,在主干网络引入高效通道注意力机制(efficient channel attention,ECA)模块,该模块通过不降维的方式实现跨通道交互,有效提升网络的特征提取能力和检测精度.其次,采用Slim-neck架构重构颈部网络,减少模型的复杂度,提高对不同尺度QR码的检测能力.最后,通过模型检测到的QR码角点,结合逆透视变换对QR码进行校正,并使用ZBar算法进行读取.实验结果表明,在公开的QR码数据集上,改进的算法相比原算法,mAP50 和mAP50-95 分别提升 1.6%和 1.1%,模型参数量和模型计算量分别降低 6.5%和 9.5%,在CPU和GPU上检测速度分别提升 0.3 f/s和 0.7 f/s,达到 14.2 f/s和 59.6 f/s,能够高效地满足QR码角点检测需求.此外,在自制的形变QR码数据集上,基于改进YOLOv8n-Pose的QR码识别方法相比单独使用ZBar算法的QR码识别方法,QR码读取率提高 23.66%,达到 87.41%.该方法仅需拍摄一张照片就可识别所有货物的信息,能够有效提高货物管理的效率.

    QR码关键点预测YOLOv8n-Pose注意力机制定位与校正

    基于多视图立体深度学习的堆叠工件三维重建

    姬田杰郑飂默曹克让王诗宇...
    153-160页
    查看更多>>摘要:随着工业自动化的不断发展,工件的三维重建技术在制造业中扮演着越来越重要的角色.在实际的工作环境下,工件普遍存在堆叠问题,对后续的机器人识别抓取等工作存在较大影响.目前三维重建技术对于一些具有弱纹理区域的工件重建,仍存在图像特征点提取难度大、特征配准精度低的问题.针对以上问题,本文提出了一种基于多视图立体匹配深度学习的堆叠工件三维重建方法.首先,输入多张不同视角的图像经过融合DCNv2 的特征金字塔网络,进行特征提取;然后,进行单应性变换构建代价体,再使用方差聚合为一个统一的代价体;接着在代价体正则化部分,引入SE通道注意力机制模块来提高网络的特征表达能力,增强模型的性能和泛化能力;此方法在DTU(Danish Technical University)数据集上具有较好的表现,并且运用该方法生成的堆叠工件点云模型对以后的工业自动化开展具有重要意义.

    多视图三维重建DCNv2级联架构通道注意力机制

    基于金字塔池化权值印记的训练后混合精度量化算法

    张瑞轩赵宇峰徐飞禹婷婷...
    161-169页
    查看更多>>摘要:模型量化方法现已广泛应用于深度神经网络模型快速推理和部署中.由于训练后量化重新训练所需时间少,性能损失小而备受研究人员关注,但现有训练后量化方法在量化过程中大多以理论假设或是固定分配网络层的比特位宽,导致量化后的网络会出现显著的性能损失,尤其是在低位情况下.为了提升训练后量化网络模型的精度,本文提出一种训练后混合精度量化方法(MSQ),该方法通过在网络模型每一层后插入一个融合了金字塔池化模块和权值印记技术的任务预测器模块,来对网络每一层进行准确度估计,从而评估每一层网络的重要性,根据重要性评估来确定每一层的量化比特位宽.实验表明,本文所提出的MSQ算法在多个流行的网络架构上都优于现有的一些混合精度量化方法,量化后的网络模型在边缘硬件设备上测试性能更好,延迟更低.

    模型量化混合精度量化金字塔池化权值印记比特位宽分配

    基于YOLOv8和改进UNet++变电站指针式仪表读数识别

    李春蕾阮艺铭张小明王宏淼...
    170-176页
    查看更多>>摘要:针对变电站仪表背景复杂、多旋转角度图像导致读数识别准确率低的问题,提出一种基于YOLOv8 和改进UNet++的指针式仪表读数识别方法.采用YOLOv8 模型检测仪表区域,并利用透视变换进行旋转校正;采用极化自注意力模块改进的UNet++算法分割表盘图像提取刻度、指针区域;经过提取指针直线后,采用角度法计算仪表读数.实验结果表明:提出方法识别仪表读数的平均引用误差为 1.82%,具有较高的识别准确性,将其应用于变电站指针式仪表智能化巡检中具有一定的可行性.

    仪表读数识别YOLOv8UNet++极化注意力图像分割

    基于标签噪声对比学习的肺癌淋巴结转移鉴别

    祁婧李子荣刘秀婷马露...
    177-184页
    查看更多>>摘要:基于深度学习的人工智能诊断模型严重依赖于高质量地详尽注释数据进行算法训练,但受到标签噪声信息的影响.为了增强模型的鲁棒性并防止有噪声的标签记忆,提出了一种标签噪声样本选择(noise label sample selection,NLSS)模型来充分挖掘噪声样本的隐藏信息,减轻模型过拟合问题.首先,通过将混合增强图像作为输入,提取图像分布式特征表示;其次,引入对比损失函数以及比较样本预测标签分布与其真实标签分布的相似性来评估样本,进行样本选择;最后,通过标签重分配模块的伪标签提升策略在样本选择的基础上重新纠正噪声标签的监督信息.以非小细胞肺癌(non-small cell lung cancer,NSCLC)患者的PET/CT数据集为例进行实验,结果表明提出的模型均比对比模型有一定的提升,可降低淋巴结转移状态诊断中标签噪声的干扰.

    深度学习标签噪声样本选择对比学习

    基于深度强化学习的四旋翼无人机抗扰控制

    徐博洋时宏伟
    185-196页
    查看更多>>摘要:随着无人机应用需求不断拓展,为了保证无人机能够按要求完成预定任务,抗干扰控制器的设计受到了诸多关注.目前广泛使用的传统控制算法稳定性较好但抗干扰能力较差.针对上述问题,提出了一种基于改进双延迟深度确定性策略梯度(TD3)算法的混合抗干扰控制器,该方法使用非线性模型预测控制(NMPC)作为基础控制器,并引入了一个基于改进TD3 的干扰补偿器进行混合控制.该方法结合了NMPC控制器的优点的同时解决了传统控制算法在抗干扰方面的不足.本文将多头注意力机制(MA)以及长短期记忆网络(LSTM)引入TD3 的Actor网络中,提高了TD3 对于空间管理信息以及时间关联信息的捕捉能力,同时引入一种连续型对数奖励函数来提高训练稳定性和收敛速度,并使用带随机干扰的随机任务场景进行训练以提高模型泛化性.在实验中将NMPC-MALSTM-TD3架构与使用DDPG、SAC、TD3、PPO算法作为干扰补偿器的架构进行对比,实验结果表明,NMPC-MALSTM-TD3架构的综合表现最好,而且对NMPC的稳定性和实时性影响较小.

    深度强化学习非线性模型预测控制TD3多头注意力LSTM

    基于改进TD3算法的无人机轨迹规划

    牟文心时宏伟
    197-209页
    查看更多>>摘要:深度强化学习算法在无人机的航迹规划任务中的应用越来越广泛,但是许多研究没有考虑随机变化的复杂场景,针对以上问题,本文提出一种基于TD3 改进的PP-CMNTD3 算法,提出了一种简单有效的先验策略并且借鉴人工势场的思想设计了密集奖励,能够更好地引导无人机有效避开障碍物并且快速接近目标点.仿真结果表明,算法的改进可以有效提高网络的训练效率以及在复杂场景中的航迹规划表现,同时能够在不同初始电量的情况下都能够灵活调整策略,做到在能耗和迅速抵达目的地之间的有效平衡.

    深度强化学习无人机航迹规划人工势场双延迟深度确定性策略梯度算法