首页期刊导航|计算机工程
期刊信息/Journal information
计算机工程
华东计算技术研究所 上海市计算机学会
计算机工程

华东计算技术研究所 上海市计算机学会

游小明

月刊

1000-3428

hdsce@sohu265359.sohuvip.net

021-54972331

200233

上海市桂林路418号

计算机工程/Journal Computer EngineeringCSCD北大核心CSTPCD
查看更多>>本刊是中国电子科技集团公司第三十二研究所(华东计算技术研究所)主办的学术性刊物,是上海市计算机学会会刊。主要特点:以最快的速度、科学求实的精神,精选刊登代表计算机行业前沿科研、技术、工程方面的高、精、尖优秀论文。贯彻党的“双百”方针,繁荣科技创作,促进国内外学术交流,探讨和传播计算机科学的理论和实践,加速和促进我国计算机事业的发展。
正式出版
收录年代

    改进U-Net的多级边缘增强医学图像分割网络

    胡帅李华玲郝德琛
    286-293页
    查看更多>>摘要:医学图像分割精度对医师临床诊疗起到关键作用,但由于医学图像的复杂性以及目标区域的多样性,造成现有医学图像分割方法存在边缘区域分割不完整和上下文特征信息利用不充分的问题。为此,提出一种改进U-Net的多级边缘增强(MEE)医学图像分割网络(MDU-Net)模型。首先,在编码器结构中加入提取双层低级特征信息的MEE模块,通过不同扩张率的扩张卷积块获取特征层中丰富的边缘信息。其次,在跳跃连接中嵌入融合相邻层特征信息的细节特征关联(DFA)模块,以获取深层次和多尺度的上下文特征信息。最后,在解码器结构对应特征层中聚合不同模块所提取的特征信息,通过上采样操作得到最终的分割结果。在2个公开数据集上的实验结果表明,与用于医学图像分割的Transformers强编码器(TransUNet)等模型相比,MDU-Net模型能够高效使用医学图像中不同特征层的特征信息,并在边缘区域取得了更好的分割效果。

    医学图像分割多级边缘增强模块注意力模块多尺度特征深度学习

    基于知识注入提示学习的专利短语相似度计算

    邓远飞李加伟蒋运承
    294-302页
    查看更多>>摘要:专利是授予发明者在一定时期内保护其发明的法定权利,在当今的社会活动中发挥着重要作用。然而现有研究并未针对专利相似度数据进行适配优化,导致其应用在专利短语相似度匹配任务中效果不佳。已有研究表明,在低资源的场景下,提示学习将文本片段(模板)作为输入,将分类问题转换为掩码语言建模问题,其关键的一步是在标签空间和标签词空间之间构造一个投影。提出一种基于知识注入的提示学习方法,将其应用于专利短语相似度匹配计算任务。为解决专利短语信息不足的问题,利用专利短语中的相似度标签信息,使用知识增强专利短语与标签信息。首先通过实体链接技术建立专利短语与外部知识的关联关系;然后设计一种基于实体影响度的邻域信息过滤机制,用于缓解专利短语信息不足的问题;最后考虑不同外部知识对专利短语相似度计算的影响,设计应用于专利短语的多种增强提示文本。实验结果表明,该方法的Pearson相关系数(PCC)和Spearman相关系数(SRC)相较次优对比方法分别提升6。8%和5。7%。

    专利短语相似度计算知识注入提示学习提示文本

    基于位置信息和注意力机制的路面裂缝检测

    王安政党建武岳彪杨景玉...
    303-312页
    查看更多>>摘要:路面裂缝是造成公路安全问题的主要因素。传统的裂缝检测通常以人工检测为主,存在效率低、不安全等问题,此外现有深度学习检测模型在面临阴影遮挡、背景复杂等干扰因素时会造成裂缝检测不完整。针对上述问题,提出一种基于位置信息和注意力机制的路面裂缝检测模型(PA-TransUNet)。首先,通过混合编码器接收输入图像,提取裂缝特征信息,引入查询项、键、值的位置信息,提升编码器Transformer中自注意力机制捕获裂缝形状和补偿特征信息丢失的能力。然后,输入裂缝特征到解码器进行上采样,设计一种基于注意力门控的解码模块(AGDM),AGDM通过抑制非裂缝区域来加强对裂缝区域的学习,提高裂缝检测的准确性和完整性。实验结果表明,PA-TransUNet模型在路面裂缝检测数据集(CFD)和Cracktree200这2个公开数据集上的F1值分别达到87。44%和82。58%。此外,为了进一步检验PA-TransUNet模型在实际工程中的裂缝检测能力,又在自制无人机裂缝(UAV Cracks)数据集上取得了 88。68%的F1值,由此可见其能较好地满足实际工程中的裂缝检测需求。

    图像处理路面裂缝检测语义分割位置信息注意力机制

    引入预训练表示混合矢量量化和CTC的语音转换

    王琳黄浩
    313-320页
    查看更多>>摘要:预训练模型通过自监督学习表示在非平行语料语音转换(VC)取得了重大突破。随着自监督预训练表示(SSPR)的广泛使用,预训练模型提取的特征中被证实包含更多的内容信息。提出一种基于SSPR同时结合矢量量化(VQ)和联结时序分类(CTC)的VC模型。将预训练模型提取的SSPR作为端到端模型的输入,用于提高单次语音转换质量。如何有效地解耦内容表示和说话人表示成为语音转换中的关键问题。使用SSPR作为初步的内容信息,采用VQ从语音中解耦内容和说话人表示。然而,仅使用VQ只能将内容信息离散化,很难将纯粹的内容表示从语音中分离出来,为了进一步消除内容信息中说话人的不变信息,提出CTC损失指导内容编码器。CTC不仅作为辅助网络加快模型收敛,同时其额外的文本监督可以与VQ联合优化,实现性能互补,学习纯内容表示。说话人表示采用风格嵌入学习,2种表示作为系统的输入进行语音转换。在开源的CMU数据集和VCTK语料库对所提的方法进行评估,实验结果表明,该方法在客观上的梅尔倒谱失真(MCD)达到8。896 dB,在主观上的语音自然度平均意见分数(MOS)和说话人相似度MOS分别为3。29和3。22,均优于基线模型,此方法在语音转换的质量和说话人相似度上能够获得最佳性能。

    预训练表示自监督学习矢量量化解耦联结时序分类

    面向国产高性能加速器的LLVM编译器设计及优化

    宋强唐俊龙陈照云时洋...
    321-331页
    查看更多>>摘要:国防科技大学自主研制的高性能加速器采用中央处理器(CPU)+通用数字信号处理器(GPDSP)的片上异构融合架构,使用超长指令集(VLIW)+单指令多数据流(SIMD)的向量化结构的GPDSP是峰值性能主要支撑的加速核。主流编译器在密集的数据计算指令排布、为指令静态分配硬件执行单元、GPDSP特有的向量指令等方面不能很好地支持高性能加速器。基于低级虚拟器(LLVM)编译框架,在前寄存器分配调度阶段,结合峰值寄存器压力感知方法(PERP)、蚁群优化(ACO)算法与GPDSP结构特点,优化代价模型,设计支持寄存器压力感知的指令调度模块;在后寄存器分配阶段提出支持静态功能单元分配的指令调度策略,通过冲突检测机制保证功能单元分配的正确性,为指令并行执行提供软件基础;在后端封装一系列丰富且规整的向量指令接口,实现对GPDSP向量指令的支持。实验结果表明,所提出的LLVM编译架构优化方法从功能和性能上实现了对GPDSP的良好支撑,GCC testsuite测试整体性能平均加速比为4。539,SPEC CPU 2017浮点测试整体性能平均加速比为4。49,SPEC CPU 2017整型测试整体性能平均加速比为3。24,使用向量接口的向量程序实现了平均97。1%的性能提升率。

    通用数字信号处理器低级虚拟器编译器指令调度向量指令接口

    面向"一带一路"的低资源语言机器翻译研究

    侯钰涛阿布都克力木·阿布力孜史亚庆马依拉木·木斯得克...
    332-341页
    查看更多>>摘要:随着"一带一路"倡议的深入推进,沿线国家和地区之间的跨语言沟通需求日渐增长,机器翻译技术逐渐成为各国之间深入交流的重要手段。然而,这些国家存在大量低资源语言,语料的稀缺性导致其机器翻译研究进展较为缓慢。针对该问题,提出一种基于NLLB模型改进的低资源语言机器翻译训练方法。首先基于多语言预训练模型提出一种改进的训练策略,该策略在数据增强的前提下,对损失函数进行优化,从而在机器翻译任务中有效提高低资源语言的翻译性能;然后使用ChatGPT以及ChatGLM模型分别评估老挝语-汉语以及越南语-汉语的翻译能力,大语言模型(LLM)已具备一定的翻译低资源语言的能力,而且ChatGPT模型在越南语-汉语翻译任务上已经大幅超越传统的神经机器翻译(NMT)模型,但是在老挝语上的翻译性能还有待进一步提高。实验结果表明,在4种低资源语言到汉语的翻译任务上,相比NLLB-600M基线模型,平均提升了 1。33个双语替换测评(BLEU)值以及0。82个chrF++值,从而充分证明了该方法在低资源语言机器翻译任务上的有效性。此外,该方法使用ChatGPT和ChatGLM模型分别对老挝语-汉语以及越南语-汉语进行了初步研究,在越南语-汉语翻译任务中,ChatGPT模型表现出色,远超传统的NMT模型,分别提高了 9。28个BLEU值和3。12个chrF++值。

    低资源语言机器翻译数据增强多语言预训练模型大语言模型

    融合全局-局部上下文信息的小目标多人姿态估计

    龙辰志陈平李传坤
    342-349页
    查看更多>>摘要:尽管多人2D姿态估计方法趋近成熟,但是现有方法无法有效识别小目标的姿态。针对当前小目标姿态难以识别的问题,提出一种融合全局-局部上下文信息的多人姿态估计方法。利用高分辨率网络(HRNet)输出的不同尺度特征对人体的多个解剖中心进行粗糙的定位,通过多个中心点给小目标提供更多的监督信息,提高对小目标的定位能力。以定位的人体中心点坐标为线索,通过可变形采样的方式提取中心点附近不同尺度的局部上下文信息,并计算不同目标局部上下文信息之间的对比损失以提高目标之间的判别能力。以HRNet网络的低分辨率特征作为全局上下文信息,以局部上下文信息作为交叉注意力的查询,结合全局和局部上下文信息构建多层Transformer模型,增强小目标的上下文信息。将增强的小目标上下文信息作为聚类中心,解耦多尺度融合的特征得到不同目标对应的关键点热图,从而实现小目标多人姿态估计。实验结果表明,该方法能够有效提高小目标姿态的识别性能,在COCO test-dev2017数据集上取得了 69。0%的平均精度(AP),APM比对偶解剖中心(DAC)方法提高1。4个百分点。

    姿态估计小目标多中心点注意力上下文信息

    基于机器视觉的手写钢板号图像增强及矫正算法研究与应用

    徐宽广何东隅韩冰刘宇佳...
    350-356页
    查看更多>>摘要:钢板号的正确识别检查是实现生产线自动化生产的重要基础条件之一。近年来,许多生产线在备料位置配备了喷印机用于自动标记物料编号。喷印的字迹清晰且耐高温,在没有涂抹的情况下使用钢板号识别设备可以实现接近100%的识别率。然而,由于喷印设备故障或受限于资金和空间等原因,有时无法安装喷印设备,只能依赖人工手写的方式在钢板表面标记编号。与喷印编号相比,手写编号存在书写随意、连笔、字迹歪斜扭曲等复杂情况,这些因素限制了识别系统的准确性。鉴于识别效果较差,通常需要依赖人工目测来辅助识别,从而影响了物料跟踪自动化的实施效果。为了提升手写钢板号的识别效果,对传统机器学习光学字符识别(OCR)文本区域检测算法进行改进研究,并针对手写钢板号的特征,提出一种图像增强和扭曲矫正处理的算法。应用结果表明,该算法可以改善手写钢板号的图像质量和形状,提高识别的准确性。该研究旨在提升手写钢板号识别效果,以解决自动化生产中的难题。通过图像增强和矫正处理,使识别系统更好地处理手写钢板号,推动物料跟踪的自动化实施。

    光学字符识别钢板号识别手写OCR区域校正OCR图像预处理自动识别

    投稿指南

    《计算机工程》编辑部
    封3页