首页期刊导航|计算机工程
期刊信息/Journal information
计算机工程
华东计算技术研究所 上海市计算机学会
计算机工程

华东计算技术研究所 上海市计算机学会

游小明

月刊

1000-3428

hdsce@sohu265359.sohuvip.net

021-54972331

200233

上海市桂林路418号

计算机工程/Journal Computer EngineeringCSCD北大核心CSTPCD
查看更多>>本刊是中国电子科技集团公司第三十二研究所(华东计算技术研究所)主办的学术性刊物,是上海市计算机学会会刊。主要特点:以最快的速度、科学求实的精神,精选刊登代表计算机行业前沿科研、技术、工程方面的高、精、尖优秀论文。贯彻党的“双百”方针,繁荣科技创作,促进国内外学术交流,探讨和传播计算机科学的理论和实践,加速和促进我国计算机事业的发展。
正式出版
收录年代

    Falcon后量子算法的密钥树生成部件GPU并行优化设计与实现

    张磊赵光岳肖超恩王建新...
    208-215页
    查看更多>>摘要:近年来,后量子密码算法因其具有抗量子攻击的特性成为安全领域的研究热点。基于格的Falcon数字签名算法是美国国家标准与技术研究所(NIST)公布的首批4个后量子密码标准算法之一。密钥树生成是Falcon算法的核心部件,在实际运算中占用较多的时间和消耗较多的资源。为此,提出一种基于图形处理器(GPU)的Falcon密钥树并行生成方案。该方案使用奇偶线程联合控制的单指令多线程(SIMT)并行模式和无中间变量的直接计算模式,达到了提升速度和减少资源占用的目的。基于Python的CUDA平台进行了实验,验证结果的正确性。实验结果表明,Falcon密钥树生成在RTX 3060 Laptop的延迟为6 ms,吞吐量为167次/s,在计算单个Falcon密钥树生成部件时相对于CPU实现了 1。17倍的加速比,在同时并行1 024个Falcon密钥树生成部件时,GPU相对于CPU的加速比达到了约56倍,在嵌入式Jetson Xavier NX平台上的吞吐量为32次/s。

    后量子密码Falcon算法图形处理器CUDA平台并行计算

    基于国产异构平台的奇异值分解法

    杨太龙赵红朋张磊
    216-225页
    查看更多>>摘要:随着深度学习等高算力应用的发展,异构计算正在逐步成为并行计算的重要方向。国产异构平台近年来发展迅速,针对国产平台的架构定制开发适配的算法与软件有着重要意义。奇异值分解(SVD)作为线性代数库中用于处理一般矩阵的强大分解器,应用在科学计算、人工智能、信号处理等众多领域。现有某类国产加速器的可用库中SVD算法性能远低于NVIDIA,这对相关应用的高效移植带来了挑战。为此,通过调整算法流程减少线程启动与访存开销,提出了面向国产加速器的矩阵双对角化方法mySVD。卸载计算密集型任务到加速器,设计面向国产异构平台的分治算法;通过CPU+加速器多流,提出了任务并行的奇异向量矩阵生成方法。最终形成一套奇异值算法的高效移植优化方案。实验结果表明,该方案在不同的测试矩阵规模上,性能最高达到现有的商业闭源线性代数库MKL的9。8倍,以及现有开源异构计算线性代数库MAGMA的5。5倍。最终将其用于图像处理,并跨平台与MATLAB、NVIDIA公司的GPU线性代数库CUSOLVER进行对比,其具有更快的速度且生成的图像与原图像相似度更高。

    并行计算异构计算奇异值分解国产平台图像处理

    基于动态粒子群优化的X结构Steiner最小树算法

    王景熠朱予涵周茹平刘耿耿...
    226-234页
    查看更多>>摘要:Steiner最小树(SMT)是总体布线的最佳连接模型,其构造是1个NP-难问题。粒子群优化(PSO)算法在解决NP-难问题中具有良好的表现,而PSO算法中种群的拓扑结构及搜索信息的传递机制对其性能有着很大的影响。1个适用于具体问题的种群拓扑结构对算法性能的提升极为显著。因此,利用PSO求解总体布线问题需要根据具体布线问题的特性来选择合适的粒子拓扑结构策略,以提升PSO的性能。提出基于动态PSO的X结构Steiner最小树(XSMT)算法以解决总体布线问题。首先,设计动态子群与信息交换策略,对种群进行子群划分,引入信息交换的概念,让子群在保持独立性的同时与其他子群进行信息交换,增加子群多样性;其次,设计粒子学习与变异策略,通过设置子群中粒子的学习对象使子群趋向于全局最优,并选择每个子群中适应度值最好的粒子进行变异,使粒子更易于跳出局部最优;最后,设计从多群局部学习过渡到单群全局学习策略,使算法在迭代次数到达阈值之后从局部学习过渡到全局学习,使得粒子在较优拓扑结构的基础上内部连接以获得更好的线长优化率。实验结果表明,与现有的2种R结构SMT(RSMT)算法相比,所提算法在优化线长方面分别优化了10。25%、8。24%;与现有的3种XSMT算法相比,该算法在优化线长方面分别优化了 2。44%、1。46%、0。48%,验证了算法的有效性。

    动态粒子群优化信息交换X结构Steiner最小树超大规模集成电路布线粒子群优化离散化

    一种基于DQN的去中心化优先级卸载策略

    张俊娜李天泽赵晓焱袁培燕...
    235-245页
    查看更多>>摘要:边缘计算(EC)可在网络边缘为用户提供低延迟、高响应的服务。因此,资源利用率高、时延低的任务卸载策略成为研究的热门方向。但大部分现有的任务卸载研究是基于中心化的架构,通过中心化设施制定卸载策略并进行资源调度,容易受到单点故障的影响,且会产生较多的能耗和较高的时延。针对以上问题,提出一种基于深度Q网络(DQN)的去中心化优先级(DP-DQN)卸载策略。首先,设置通信矩阵模拟现实中边缘服务器有限的通信状态;其次,通过对任务设定优先级,使任务可以在不同边缘服务器之间跳转,保证各边缘服务器均可以自主制定卸载策略,完成任务卸载的去中心化;最后,根据任务的跳转次数为任务分配更多的计算资源,提高资源利用效率和优化效果。为了验证所提策略的有效性,针对不同DQN下参数的收敛性能进行了研究对比,实验结果表明,在不同测试情景下,DP-DQN的性能均优于本地算法、完全贪婪算法和多目标任务卸载算法,性能可提升约11%~19%。

    边缘计算任务卸载资源分配去中心化优先级深度Q网络

    基于多通道的彩色图像多重水印算法

    郑秋梅赵丹牛薇薇林超...
    246-254页
    查看更多>>摘要:针对多重水印技术如何确定最优的嵌入区域,以实现多个水印之间的权衡问题,提出一种基于多通道嵌入的彩色图像多重水印算法。当嵌入水印时,选择在彩色图像R、G、B3个通道嵌入不同的水印图像,目的是嵌入更多的水印信息。通过提升小波变换(LWT)和非下采样剪切波变换(NSST)提取宿主图像每个通道中的方向性特征,确定水印的嵌入位置,以提高对常规攻击和几何攻击的鲁棒性。通过将加密的水印有效信息嵌入到具有良好稳定性的奇异值矩阵中,保证水印的提取效果。实验结果表明,嵌入水印后的图像峰值信噪比(PSNR)在43 dB以上,所提算法具备良好的不可见性,对嵌入水印后的图像进行高强度的旋转、滤波、剪切等攻击,提取水印的归一化系数(NC)值在0。95以上,其中,滤波攻击对应的NC值可以达到0。99以上,水印信息提取完整、清晰可辨,表现出较强的鲁棒性。同时,该算法可以1次嵌入3个水印图像,具有更高的嵌入容量。因此,与现有的多重水印算法相比,该算法的不可见性、鲁棒性和嵌入容量均有较大的提升。

    多重水印提升小波变换非下采样剪切波变换鲁棒性嵌入容量

    基于可变形三维图卷积的轻量级点云分类研究

    蔡俊民梁正友孙宇陈子奥...
    255-265页
    查看更多>>摘要:现有深度学习方法在处理点云分类任务时,依赖于点的绝对坐标,存在模型复杂度较大的问题。对此,提出一种轻量级的点云分类网络DMGCN-3D。使用自适应空洞K近邻(KNN)算法构造图结构,尽可能捕捉局部更广泛空间的几何结构信息,并减少计算开支;构造可变形三维图卷积,引入可学习的点与点之间的方向向量来获取相对特性,在特征提取过程中保证点云的置换不变性与尺度不变性;构建多头自注意力模块,通过残差结构将分组变换注意力(GSA)与多层感知机(MLP)相结合,MLP有助于保持原始点云信息的完整性,GSA使得网络能够学习特征内部的自相关性,在提高特征表达能力的同时降低参数总量;使用空间变换网络结合MLP来学习点云特征;对所提取的特征进行融合以得到更综合的特征,将其用于点云分类。实验结果表明,DMGCN-3D在ModelNet10、ModelNet40、ScanObjectNN 数据集上的总体精度分别达到 96。5%、94。7%、81。9%,比 DGCNN 分别提高2。9、2。1、3。8个百分点,参数总量相比DGCNN、LDGCNN、3DGCN模型分别降低52。9%、23。9%、3。3%,且DMGCN-3D能够保持较高的鲁棒性。

    点云分类可变形三维图卷积自适应多头自注意力轻量级网络

    用于低剂量CT图像去噪的多级双树复小波网络

    张鲁田春伟宋焕生刘侍刚...
    266-275页
    查看更多>>摘要:基于卷积神经网络(CNN)的图像去噪方法能有效去除低剂量计算机断层扫描(CT)图像伴随的伪影和噪声,从而确保CT设备输出高质量图像同时降低辐射,这对患者健康和医学诊断具有重要意义。为了进一步提高低剂量CT图像的质量,提出一种小波域去噪网络MDTNet。首先,基于双树复小波变换(DTCWT)构造多级编解码去噪网络,在多个尺度上提取特征以保留更多高频细节;然后,利用扩展的像素重排技术替代卷积上下采样,实现多级输入和特征融合,从而降低计算复杂度;最后,通过大量训练找到最佳的去噪模型,即二级MDTNet配合LeGall滤波器和Qshift_b滤波器,并选择较大尺寸的CT图像作为训练数据。使用AAPM数据集评估MDTNet的性能,实验结果表明,MDTNet能有效去除条纹状伪影和噪声,在定量和定性评估中性能均优于同类型去噪方法。与FWDNet相比,对于1 mm的切片,MDTNet的平均峰值信噪比(PSNR)和结构相似性指数(SSIM)分别提高了 0。088 7 dB和0。002 4;对于3 mm的切片,分别提升了 0。144 3 dB和0。003。对于单张512×512像素的低剂量CT图像去噪,MDTNet在GPU上仅需0。193 s。MDTNet在保持高效率的同时保留了更多的高频细节,能够为低剂量CT图像去噪提供一种新的框架。

    低剂量CT图像图像去噪卷积神经网络双树复小波变换像素重排

    基于Transformer的多阶段运动模糊图像修复网络

    朱凯李理张彤江晟...
    276-285页
    查看更多>>摘要:运动模糊是导致图像退化的常见原因,其限制了图像的可读性和后续处理效果。针对卷积网络感受野有限以及常规多阶段网络中信息丢失的问题,提出一种基于Transformer的多阶段去模糊网络。网络采用多阶段编码器-解码器结构,在单个阶段内和多个阶段间采用跳跃连接来增强信息的传递。首先,高效Transformer模块采用通道注意力和深度卷积来处理图像的全局和局部信息;其次,多分支结构的前馈传播网络通过引入多个并行的分支,实现了不同尺度和不同层次的特征提取和融合;最后,通过多阶段的残差处理实现更优的图像恢复结果。实验结果显示,在GoPro数据集上该网络的峰值信噪比(PSNR)达到32。23 dB,结构相似性指数(SSIM)达到0。955,在 HIDE 数据集上 PSNR 和 SSIM 分别达到 30。15 dB 和 0。930,优于 DeepDeblur、DeblurGAN-V2 等模型。

    深度学习Transformer模型注意力机制图像修复多尺度网络

    基于双分支序列残差注意力的场景文本图像超分辨率重建

    李大海吕春桂王振东
    286-295页
    查看更多>>摘要:针对现有场景文本图像超分辨率重建方法存在的重建文本图像细节信息丢失和边缘模糊的问题,提出一种基于双分支序列残差注意力的重建方法DSRASRN。首先,DSRASRN采用一种新的双分支序列残差注意力模块(DSRAB),该模块采用双分支结构分别专注于水平和垂直方向上的上下文信息提取,并通过高效通道注意力(ECA)机制给予重要信息更高的权重,以增强特征的表达;其次,在DSRASRN内新增文本边缘感知模块(TEAB),增强对文本图像边缘细节和纹理的处理,TEAB采用特定方向的卷积核捕捉特定空间方向上的信息,同时结合具有不同空洞率的空洞卷积来扩大感受野并增强对高频信息的重建能力。在真实场景文本图像数据集TextZoom上的实验结果表明,DSRASRN不仅可以重建出更多的图像细节信息,而且在提高文本识别准确率方面也表现出明显优势。与TSRN、TBSRN、TG、TPGSR方法相比,DSRASRN的峰值信噪比(PSNR)分别提升0。27、0。78、0。59和0。51 dB,且DSRASRN可以使文本识别器ASTER、MORAN和CRNN的平均文本识别精度分别达到65。0%、62。1%和52。0%。此外,真实场景文本识别图像数据集ICDAR2015和SVT上的测试结果表明DSRASRN具有良好的泛化能力。

    超分辨率重建场景文本图像双分支序列残差特征增强边缘感知

    融合快速傅里叶卷积的域变换图像去雨滴方法

    阳金霖李朝锋
    296-303页
    查看更多>>摘要:在下雨天气中,玻璃上的雨滴会对图像质量产生严重影响,且目前的去雨滴方法过度依赖成对图像,使得无监督图像雨滴去除面临较大挑战。针对这一问题,提出一种域变换图像去雨滴方法。构建域变换网络(DTN),通过有雨与无雨域之间的变换,以无监督的方式实现图像的雨滴去除。同时,通过引入快速傅里叶卷积(FFC)来设计生成网络和判别网络,实现全局与局部特征的信息交互。在FFC中,通过频谱变换(ST)对空间域和频域进行转换,克服传统卷积神经网络(CNN)感受野不足的问题,从而更好地感知细小的雨滴。在2个真实的雨滴测试集上进行去雨滴实验,结果表明,该方法在定量结果和视觉效果上均优于现有的先进方法。与改进前的U-Net+马尔可夫判别网络相比,改进后的该方法在峰值信噪比(PSNR)和结构相似性指数(SSIM)上分别提升3。37 dB和0。031 3,并且其能在去除雨滴的同时还原更多的图像纹理细节。

    图像雨滴去除快速傅里叶卷积无监督学习域变换频谱变换