首页期刊导航|计算机系统应用
期刊信息/Journal information
计算机系统应用
计算机系统应用

苏振泽

月刊

1003-3254

csa@iscas.ac.cn

010-62661041

100080

北京中关村南四街4号

计算机系统应用/Journal Computer Systems & ApplicationsCSCD北大核心CSTPCD
查看更多>>专业技术性刊物。推广计算机系统在各行各业的应用技术成果和运行管理经验。
正式出版
收录年代

    降质感知的小波变换水下图像增强网络

    刘祎恒邓箴
    201-207页
    查看更多>>摘要:针对现有水下图像增强算法不能感知降质,易丢失细节,无法有效纠正色偏等问题,提出了降质感知的小波变换水下图像增强网络模型.该模型主要包含对比学习的降质表征提取网络和多级小波变换的水下图像增强网络.首先,降质表征提取网络利用编码器和对比学习的方法,从每张水下图像中提取特有的降质表征;随后,以多级小波变换增强算法为指导思想,构建三级小波变换模块,旨在从频率域上实施多尺度的细节和颜色增强;最后,构建基于三级小波变换模块的多级小波变换增强网络,并将提取的降质表征引入到该网络中,以便在感知降质信息后,更好地实施多级小波变换增强.实验结果表明,本算法较已有算法具有更强的颜色校正,细节增强能力,增强结果在结构相似性指标上提升16%,峰值信噪比指标上提升9%,水下图像质量指标上提升14%,能用于水下图像增强任务.

    图像增强小波变换降质感知深度学习

    融合注意力机制和二次特征提取的ResNet小样本农作物病虫害识别

    汪志立王定成曹蓉郑梦丽...
    208-215页
    查看更多>>摘要:针对传统机器学习方法对于小样本和多类别的农作物叶片病虫害识别效果和时间不理想的问题,本文利用改进的ResNet模型来实现农作物病害识别.通过加入dropout层、激活函数、最大池化层和注意力机制来提高模型的鲁棒性、特征捕捉能力、实现了用较低的模型参数量来提高病虫害识别的准确率.首先对从公共数据集Plant Village获取的图像进行预处理和增强,将ReLU激活函数替换为PReLU,解决ReLU函数在小于0部分神经元坏死的问题;然后在全局平均池化层之前加入dropout层,设置合理的阈值,有效避免过拟合现象的发生,增强模型的鲁棒性;此外,在dropout与全局平均池化层之间加入最大池化层,不仅能扩大神经元的感受野,还能帮助模型获取局部病虫害的最显著特征,减小图片背景的噪声影响,实现二次特征提取;最后嵌入CBAM注意力机制,使模型自动学习输入特征图中最重要的通道信息,并对其进行通道与空间之间加权,从而更好地捕捉图像中的语义信息.实验结果表明,改进后的模型对测试集识别准确度达 99.15%,模型参数量仅为 9.13M,与Xception、InceptionV3、原ResNet等模型相比,准确率分别超过了 1.01,0.68,0.59 个百分点,降低了模型参数量,为农作物病虫害识别提供了一种先进的深度学习方法.

    病虫害识别注意力机制迁移学习最大池化激活函数PReLU

    基于多重互信息约束的高表现力语音转换

    王光刘宗泽姜彦吉董浩...
    216-225页
    查看更多>>摘要:随着语音转换在人机交互领域的广泛应用,对于获取高表现力语音的需求日益显著.当前语音转换主要通过解耦声学特征实现,侧重对内容和音色特征的解耦,很少考虑语音中混合的情感特性,导致转换音频情感表现力不足.为解决上述问题,本文提出一种基于多重互信息约束的高表现力语音转换模型(MMIC-EVC).在对内容和音色特征进行解耦的基础上,引入表现力模块分别对话语级韵律和节奏特征进行建模,以实现情感特性的传递;随后通过最小化各特征之间的多重互信息变分对数上界,约束各编码器专注于解耦对应的声学嵌入.在CSTR-VCTK和ESD语音数据集上的实验表明,本模型的转换音频语音自然度评分(MOS)达到 3.78,梅尔倒谱失真为 5.39 dB,最佳最差占比测试结果大幅领先于基线模型,MMIC-EVC能够有效解耦韵律和节奏特征,并实现高表现力语音转换,为人机交互带来更加出色和自然的用户体验.

    语音转换特征解耦互信息约束韵律建模人机交互

    应用FFB-EWT的OFDM辐射源个体识别

    刘高辉李瑞琛
    226-234页
    查看更多>>摘要:针对在传统辐射源个体识别方法中OFDM辐射源细微指纹特征信息会受到数据信号成分和信道噪声的影响会导致分类识别率低的问题,根据短导码的子载波频谱特点设计了一种基于固定频率边界的经验小波变换(frequency fixed boundary-empirical wavelet transform,FFB-EWT)和深度残差网络的OFDM辐射源个体识别方法.首先,提取OFDM信号的短导码,根据短导码中传输信号子载波的频率间隔划分固定边界条件,将频域边界值应用于FFB-EWT对信号进行分解,去除包含前导序列信息的子载波分量;其次,对相邻帧中包含指纹特征的空子载波分量进行积累,提高指纹特征信号的信噪比;然后,使用双通道的结合了非局部注意力模块和通道注意力模块的ResNet18 残差网络,对IQ两路数据输入进行特征提取,通过Softmax函数进行分类;最后,选择Oracle公开数据集验证方法的可行性.实验结果表明利用FFB-EWT方法对 6 个不同辐射源个体在 6dB和 0dB条件下进行识别,准确率可以达到98.17%和89.33%,证明了该方法在低信噪比条件下的有效性.

    辐射源个体识别固定频率边界经验小波变换残差网络

    面向电力系统暂态稳定性的联邦学习拜占庭节点检测

    王子璇吕娜王瀚璇周学财...
    235-244页
    查看更多>>摘要:针对分布式智能电网各电力系统区域联合进行暂态稳定性判定和可能遇到的网络攻击问题,提出了一种基于联邦学习的分布式电力系统暂态稳定判别算法及拜占庭节点检测算法.联邦学习框架中,各区域电网独立采用神经网络进行判稳,中央服务器综合训练梯度并反馈更新.为了提高该联邦学习框架的安全性,通过对各区域电网的更新梯度进行聚类,从而甄别离群点,即受到攻击的区域电网,实现拜占庭节点检测.考虑到梯度的高维特性,直接聚类会出现距离度量不准确的问题,因此通过在线训练自编码器降维,并对降维后的梯度进行密度聚类,选择包含节点数目少的类别作为拜占庭节点集合,并永久剔除拜占庭节点提供的梯度.采用功角稳定机电暂态仿真算例进行验证,结果表明,本方法解决了电力系统暂稳判定时遇到的网络攻击问题,相比其他方法具有明显提升的平均准确率和稳定性,能有效避免判别准确率跳变情况.

    智能电网分布式学习联邦学习网络攻击暂态稳定

    基于深度强化学习的分层自适应PID控制算法

    余文浩齐立哲梁瀚文孙云权...
    245-252页
    查看更多>>摘要:比例积分微分(PID)控制在工业控制和机器人控制领域应用非常广泛.然而,其在实际应用中存在参数整定复杂、系统无法精准建模以及对被控对象变化敏感的问题.为了解决这些问题,本文提出了一种基于深度强化学习算法的分层自适应PID控制算法,即TD3-PID,用于移动机器人的自动控制.其中,上层控制器通过实时观测当前环境状态和系统状态实现对下层PID控制器参数和输出补偿量进行调整,以实时补偿误差从而优化系统性能.本文将所提出的TD3-PID控制器应用于 4 轮移动机器人轨迹跟踪任务并和其他控制方法进行了真实场景实验对比.结果显示TD3-PID控制器表现出更优越的动态响应性能和抗干扰能力,整体响应误差显著减小,在提高控制系统性能方面具有显著的优势.

    深度强化学习PID算法自适应控制确定性策略梯度算法轨迹跟踪

    基于改进YOLOv5s的路面病害检测

    高晶姚金杰刘鹏杰郭钰荣...
    253-260页
    查看更多>>摘要:针对路面病害检测中因病害形态多样、尺度差异大、背景灰度值相似而导致检测精度较低的问题,提出一种改进的轻量化路面病害检测模型PD-YOLOv5s(pavement disease-YOLOv5s).首先,模型嵌入三维无参数注意力机制SimAM,在不额外增加模型参数的同时有效增强模型在复杂环境下的特征提取能力;其次,引入残差块Res2NetBlock增加模型感受野,增强模型在更细粒度层次上的特征融合能力.最后,构建SPD-GSConv模块完成下采样,从而有效捕捉不同尺度的目标特征,将提取的特征融入模型完成路面病害分类检测.在真实路面病害数据集上实验结果表明:相较于原YOLOv5s,PD-YOLOv5s模型平均精度值(mAP)提升 4.7%,参数量降低至 6.78M,检测速度达到 53.97 f/s.PD-YOLOv5s在降低网络计算成本的同时具有优越的检测性能,对路面病害检测具有工程应用价值.

    路面病害目标检测深度学习YOLOv5SPD-GSConv

    基于对比学习及背景挖掘的少样本语义分割

    王善杰
    261-268页
    查看更多>>摘要:少样本语义分割是在具有少量标注样本的查询图像的条件下,对潜在对象类别进行分割的计算机视觉任务.然而,现有方法仍然存在两个问题,这对它们构成了挑战.首先是原型偏差问题,这导致原型具有较少的前景目标信息,难以模拟真实的类别统计信息.另一个是特征破坏问题,这意味着模型只关注当前类别而不关注潜在类别.本文提出了一个基于对比原型以及背景挖掘的新网络.该网络主要思想是使模型学习更具代表性的原型,并从背景中识别潜在类别.具体而言,特定类学习分支构建了一个大且一致的原型字典,然后使用InfoNCE损失使原型更具区分性.另一方面,背景挖掘分支初始化背景原型,并使用构建的背景原型与字典之间的注意力机制来挖掘潜在类别.在PASCAL-5i和COCO-20i数据集上的实验证明模型有优秀的性能.在使用ResNet-50 网络的 1-shot设置下,达到了64.9%和44.2%,相较于基准模型分别提升了4.0%和1.9%.

    图像分割少样本语义分割对比学习背景挖掘

    基于注意力特征融合的跨模态行人重识别

    邓淑雅李浩源
    269-275页
    查看更多>>摘要:跨模态行人重识别任务旨在匹配同一行人的可见光图像和红外图像,在智能安全监控系统中广泛应用.由于可见光模态和红外模态存在固有的模态差异,给跨模态行人重识别任务在实际应用过程中带来了巨大的挑战.为了缓解模态差异,研究人员提出了很多有效的解决方法.但是由于这些方法提取的是不同模态之间的特征,彼此缺少对应的模态信息,导致特征缺少充分的鉴别性.为了提高模型提取特征的鉴别性,本文提出基于注意力特征融合的跨模态行人重识别方法.通过设计高效的特征提取网络和注意力融合模块,并在多种损失函数的优化下,实现不同模态信息的融合和模态对齐,从而促进模型匹配行人准确度的提升.实验结果表明,本方法在多个数据集上都取得了很好的性能.

    跨模态行人重识别注意力机制特征融合模态差异模态对齐

    《计算机系统应用》稿约

    前插1页