首页期刊导航|计算机系统应用
期刊信息/Journal information
计算机系统应用
计算机系统应用

苏振泽

月刊

1003-3254

csa@iscas.ac.cn

010-62661041

100080

北京中关村南四街4号

计算机系统应用/Journal Computer Systems & ApplicationsCSCD北大核心CSTPCD
查看更多>>专业技术性刊物。推广计算机系统在各行各业的应用技术成果和运行管理经验。
正式出版
收录年代

    基于显著图的高隐蔽性模型指纹算法

    张圣尧潘旭东张谧
    1-12页
    查看更多>>摘要:在核心任务场景下训练深度神经网络(DNN)需要越来越多的算力资源,这刺激了基于云端预测API接口的模型的窃取与盗用,同时也违反了模型所有者的知识产权.为了追踪公开的非法模型副本,深度神经网络的模型指纹技术为希望保持模型完整性的模型所有者提供了一种强大的版权验证方案.然而,现有的模型指纹方案主要基于输出层面的内在痕迹(例如:特定输入样本下的错误预测行为),这导致在模型指纹验证阶段缺乏隐蔽性.本文基于模型预测时的显著图(saliency map)痕迹,提出了一种全新的任意下游任务通用的模型指纹方案.本文的方案提出了受约束的显著图操控目标,构建标签不变和自然的指纹样本,显著提高了模型指纹的隐蔽性.根据对 3 种典型任务场景下全面的评估结果,本文提出的方法被证明能够显著地增强现有方案的指纹版权验证的效果,同时保持高度的模型指纹隐蔽性.

    模型指纹模型产权保护显著图隐蔽性

    基于双编码器表示学习的多模态情感分析

    冼广铭阳先平招志锋
    13-25页
    查看更多>>摘要:多模态情感分析旨在通过用户上传在社交平台上的视频来判断用户的情感.目前的多模态情感分析研究主要是设计复杂的多模态融合网络来学习模态之间的一致性信息,在一定程度上能够提升模型的性能,但它们大部分都忽略了模态之间的差异性信息所起到的互补作用,从而导致情感分析出现偏差.本文提出了一个基于双编码器表示学习的多模态情感分析模型DERL(dual encoder representation learning),该模型通过双编码器结构学习模态不变表征和模态特定表征.具体来说,我们利用基于层级注意力机制的跨模态交互编码器学习所有模态的模态不变表征,获取一致性信息;利用基于自注意力机制的模态内编码器学习模态私有的模态特定表征,获取差异性信息.此外,我们设计两个门控网络单元对编码后的特征进行增强和过滤,以更好地结合模态不变和模态特定表征,最后在融合时通过缩小不同多模态表示之间的L2 距离以捕获它们之间潜在的相似情感用于情感预测.在两个公开的数据集CMU-MOSI和CMU-MOSEI上的实验结果表明该模型优于一系列基线模型.

    多模态情感分析双编码器层级注意力门控网络单元相似情感

    卷积神经网络在肝癌病理图像诊断中的应用综述

    邵润华刘静马金刚王一凡...
    26-38页
    查看更多>>摘要:肝癌是一种恶性肝肿瘤,起源于肝细胞.肝癌诊断一直是医学难点问题,也是各领域研究的热点问题,早期确诊肝癌可以降低肝癌的死亡率.组织病理学图像检查是肿瘤学诊断的黄金标准,图像会显示组织切片的细胞和组织结构,可以用于确定细胞类型、组织结构、异常细胞的数量和形态,并评估肿瘤具体情况.本文重点研究了卷积神经网络针对病理图像的肝癌诊断算法,包括肝肿瘤检测、图像分割以及术前预测这 3 个方面的应用,详细阐述了卷积神经网络各算法的设计思路和相关改进目的及方法,以便为研究人员提供更清晰的参考思路.总结性分析了卷积神经网络算法在诊断中的优缺点,并对未来可能的研究热点和相关难点进行了探讨.

    图像处理卷积神经网络肝癌肝肿瘤组织病理学图像

    基于联邦学习与改进CBAM-ResNet18的脑肿瘤分类

    吴波史东辉吕东来胡涛...
    39-49页
    查看更多>>摘要:针对联邦学习框架下,基于卷积注意力模块的多客户端脑肿瘤分类方法对于MRI图像中肿瘤区域细节提取能力不足、通道注意力与空间注意力相互干扰的问题,以及针对多点医疗肿瘤数据分类准确性低的问题,提出了一种融合联邦学习框架和改进的CBAM-ResNet18 网络的脑肿瘤分类方法.利用联邦学习特性联合多点脑肿瘤数据,采用Leaky ReLU激活函数代替ReLU激活函数以减轻神经元死亡,将卷积注意力模块中的通道注意力模块由先降维再升维改成先升维再降维,充分提高网络对图像细节的提取能力,将卷积注意力模块中的通道注意力模块与空间注意力模块由级联结构改为并联结构,使得网络的特征提取能力不会受到二者先后顺序的影响.通过在Kaggle公开的脑肿瘤MRI数据集上的进行实验,该方法的准确率、精准度、召回率与F1 值分别为 97.78%、97.68%、97.61%与 97.63%,比基准模型分别高 6.54%、4.78%、6.80%、7.00%.实验结果证明,该方法不仅能够打破数据孤岛,实现多点数据融合,而且比多数现有主流模型的性能更好.

    脑肿瘤分类联邦学习卷积注意力模块残差网络数据孤岛

    辅助视障出行融合障碍物检测的路径规划研究进展

    冯今瑀张魁星张铁林李延军...
    50-59页
    查看更多>>摘要:视障人士是社会中的弱势群体,独立出行面临重重障碍.为视障人士提供安全可靠的辅助设备体现了社会文明的进步.介绍了辅助视障出行有关的障碍物检测识别关键技术和路径规划相关算法.重点对障碍物检测之后的路径规划算法进行分析,综合对比各种技术的应用特点及场景并讨论了相关方法在视障辅助设备中的研究进展.总结了多技术融合使用在智能辅助设备中的应用现状.在此基础上,结合人工智能及嵌入式设备等技术的进步展望了未来辅助视障出行设备的发展方向.

    视障辅助设备障碍物检测路径规划目标检测深度强化学习

    深度复数轴向自注意力卷积循环网络的语音增强

    曹洁王乔梁浩鹏王宸章...
    60-68页
    查看更多>>摘要:单通道语音增强任务中相位估计不准确会导致增强语音的质量较差,针对这一问题,提出了一种基于深度复数轴向自注意力卷积循环网络(deep complex axial self-attention convolutional recurrent network,DCACRN)的语音增强方法,在复数域同时实现了语音幅度信息和相位信息的增强.首先使用基于复数卷积网络的编码器从输入语音信号中提取复数表示的特征,并引入卷积跳连模块用以将特征映射到高维空间进行特征融合,加强信息间的交互和梯度的流动.然后设计了基于轴向自注意力机制的编码器-解码器结构,利用轴向自注意力机制来增强模型的时序建模能力和特征提取能力.最后通过解码器实现对语音信号的重构,同时利用混合损失函数优化网络模型,提升增强语音信号的质量.实验在公开数据集Valentini和DNS Challenge上进行,结果表明所提方法相对于其他模型在客观语音质量评估(perceptual evaluation of speech quality,PESQ)和短时客观可懂度(short-time objective intelligibility,STOI)两项指标上均有提升,在非混响数据集中,PESQ比DCTCRN(deep cosine transform convolutional recurrent network)提高了 12.8%,比DCCRN(deep complex convolutional recurrent network)提高了 3.9%,验证了该网络模型在语音增强任务中的有效性.

    单通道语音增强复数卷积循环网络卷积跳连轴向自注意力机制

    边缘计算中基于区块链的轻量级密文访问控制方案

    郑嘉诚何亨陈月佳肖天哲...
    69-81页
    查看更多>>摘要:密文策略属性基加密(ciphertext-policy attribute-based encryption,CP-ABE)技术可以在保证数据隐私性的同时提供细粒度访问控制.针对现有的基于CP-ABE的访问控制方案不能有效解决边缘计算环境中的关键数据安全问题,提出一种边缘计算环境中基于区块链的轻量级密文访问控制方案(blockchain-based lightweight access control scheme over ciphertext in edge computing,BLAC).在BLAC中,设计了一种基于椭圆曲线密码的轻量级CP-ABE算法,使用快速的椭圆曲线标量乘法实现算法加解密功能,并将大部分加解密操作安全地转移,使得计算能力受限的用户设备在边缘服务器的协助下能够高效地完成密文数据的细粒度访问控制;同时,设计了一种基于区块链的分布式密钥管理方法,通过区块链使得多个边缘服务器能够协同地为用户分发私钥.安全性分析和性能评估表明BLAC能够保障数据机密性,抵抗共谋攻击,支持前向安全性,具有较高的用户端计算效率,以及较低的服务器端解密开销和存储开销.

    边缘计算区块链访问控制密文策略属性基加密椭圆曲线

    融合多种时空自注意力机制的Transformer交通流预测模型

    曹威王兴邹复民金彪...
    82-92页
    查看更多>>摘要:交通流预测是智能交通系统中实现城市交通优化的一种重要方法,准确的交通流量预测对交通管理和诱导具有重要意义.然而,因交通流本身存在高度时空依赖性而表现出复杂的非线性特征,现有的方法主要考虑路网中节点的局部时空特征,忽略了路网中所有节点的长期时空特征.为了充分挖掘交通流数据复杂的时空依赖,提出一种融合多种时空自注意力机制的Transformer交通流预测模型(MSTTF).该模型在嵌入层通过位置编码嵌入时间和空间信息,并在注意力机制层融合邻接空间自注意力机制,相似空间自注意力机制,时间自注意力机制,时间-空间自注意力机制等多种自注意力机制挖掘数据中潜在的时空依赖关系,最后在输出层进行预测.结果表明,MSTTF模型与传统时空Transformer相比,MAE平均降低了 10.36%.特别地,相比于目前最先进的PDFormer模型,MAE平均降低了1.24%,能取得更好的预测效果.

    交通流预测智能交通时空依赖性Transformer自注意力机制

    基于小样本学习融合随机深度和多尺度卷积的SDM-RNET网络

    刘馨瑶梁军余嘉琳
    93-102页
    查看更多>>摘要:针对神经网络难以利用少量标注数据获取足够的信息来正确分类图像的问题,提出了一种融合随机深度网络和多尺度卷积的关系网络——SDM-RNET.首先在模型嵌入模块引入随机深度网络用于加深模型深度,然后在特征提取阶段采用多尺度深度可分离卷积替代普通卷积进行特征融合,经过骨干网络后再采用深浅层特征融合获取更丰富的图像特征,最终学习预测出图像的类别.在mini-ImageNet、RP2K、Omniglot这 3 个数据集上对比该方法与其他小样本图像分类方法,结果表明在5-way 1-shot和5-way 5-shot分类任务上该方法准确率最高.

    深度学习小样本学习图像分类

    基于模糊模式感知模块的场景文本图像超分辨率算法

    张密余海洋
    103-112页
    查看更多>>摘要:现有的场景文本识别器容易受到模糊文本图像的困扰,导致在实际应用中性能较差.因此近年来研究人员提出了多种场景文本图像超分辨率模型作为场景文本识别的预处理器,以提高输入图像的质量.然而,用于场景文本图像超分辨率任务的真实世界训练样本很难收集;此外,现有的场景文本图像超分辨率模型只学习将低分辨率(LR)文本图像转换为高分辨率(HR)文本图像,而忽略了从HR到LR图像的模糊模式.本文提出了模糊模式感知模块,该模块从现有的真实世界HR-LR文本图像对中学习模糊模式,并将其转移到其他HR图像中,以生成具有不同退化程度的LR图像.本文所提出的模糊模式感知模块可以为场景文本图像超分辨率模型生成大量的HR-LR图像对,以弥补训练数据的不足,从而显著提高性能.实验结果表明,当配备提出的模糊模式感知模块时,场景文本图像超分辨率方法的性能可以进一步提高,例如,SOTA方法TG在使用CRNN文本识别器进行评估时,识别准确率提高了5.8%.

    场景文本图像超分辨率场景文本识别图像模糊模式条件生成对抗网络深度学习