首页期刊导航|计算机工程
期刊信息/Journal information
计算机工程
华东计算技术研究所 上海市计算机学会
计算机工程

华东计算技术研究所 上海市计算机学会

游小明

月刊

1000-3428

hdsce@sohu265359.sohuvip.net

021-54972331

200233

上海市桂林路418号

计算机工程/Journal Computer EngineeringCSCD北大核心CSTPCD
查看更多>>本刊是中国电子科技集团公司第三十二研究所(华东计算技术研究所)主办的学术性刊物,是上海市计算机学会会刊。主要特点:以最快的速度、科学求实的精神,精选刊登代表计算机行业前沿科研、技术、工程方面的高、精、尖优秀论文。贯彻党的“双百”方针,繁荣科技创作,促进国内外学术交流,探讨和传播计算机科学的理论和实践,加速和促进我国计算机事业的发展。
正式出版
收录年代

    基于大语言模型的中文科技文献标注方法

    杨冬菊黄俊涛
    113-120页
    查看更多>>摘要:高质量的标注数据是中文科技文献领域自然语言处理任务的重要基石。针对目前缺乏中文科技文献的高质量标注语料以及人工标注质量参差不齐且效率低下的问题,提出一种基于大语言模型的中文科技文献标注方法。首先,制定适用于多领域中文科技文献的细粒度标注规范,明确标注实体类型以及标注粒度;其次,设计结构化文本标注提示模板和生成解析器,将中文科技文献标注任务设置成单阶段单轮问答过程,将标注规范和带标注文本填充至提示模板中相应的槽位以构建任务提示词;然后,将提示词注入到大语言模型中生成包含标注信息的输出文本,经由解析器解析得到结构化的标注数据;最后,利用基于大语言模型的提示学习生成中文科技文献实体标注数据集ACSL,其中包含分布在48个学科的10 000篇标注文档以及72 536个标注实体,并在ACSL上提出基于RoBERTa-wwm-ext的3个基准模型。实验结果表明,BERT+Span模型在长跨度的中文科技文献实体识别任务中表现最佳,F1值为0。335。上述结果可作为后续研究的测试基准。

    文本标注方法中文科技文献大语言模型提示学习信息抽取

    基于跨模态注意力的目标语音提取

    杨明强卢健
    121-129页
    查看更多>>摘要:目标语音提取作为语音分离领域的一部分,旨在从混合语音数据中提取出目标语音。考虑到视听信息具有天然一致性,在进行模型训练时,可以融合视觉信息指导模型对目标语音的提取。对此,传统方法是将视觉特征和音频特征进行简单拼接,然后进行卷积操作实现通道融合,这种方法无法有效挖掘到跨模态信息间的相关性。针对这个问题,设计一个基于两阶段的跨模态注意力特征融合模块。在第一阶段进行点积注意力计算来挖掘跨模态信息间存在的浅层相关性,在第二阶段进行自注意力计算来捕捉目标语音特征间的全局依赖关系,以增强目标语音的特征表示,2个融合阶段分别训练不同的可学习参数来调节注意力权重。此外还在时间卷积网络(TCN)中引入门控循环单元(GRU)来增强其捕捉序列数据间长期依赖关系的能力,从而改善视觉特征的提取,进一步提升视听特征的融合效果。在VoxCeleb2和LRS2-BBC两个数据集上进行测试,实验结果表明,相比于基线方法,提出的方法在2个数据集上都有较好的表现,在评估指标源失真比(SDR)上分别提升了 1。05 dB和0。26 dB。

    目标语音提取跨模态融合自注意力时间卷积网络门控循环单元

    基于Transformer的目标跟踪与分割统一算法

    林畅郭伟任哲聪金海波...
    130-141页
    查看更多>>摘要:采用相关滤波的判别式目标跟踪算法因具有较好的跟踪效果得到广泛关注,但该类方法使用的矩形框估计法通常只能得到目标正矩形框,难以获得目标更加精细的状态信息,如旋转矩形框、目标轮廓、掩码信息等。为解决上述问题,提出一种基于Transformer的单目标跟踪与分割统一算法T-TS,利用Transformer的注意力机制优势对目标精确定位,通过得到的目标定位编码信息引导目标分割网络对目标进行前、背景分割,获得目标精细掩码,再对掩码进行形态学处理,优化得到目标的最佳旋转矩形框及其轮廓。在跟踪数据集VOT2018和分割数据集DAVIS上进行实验,结果显示,T-TS算法与孪生网络类算法相比具有更高的鲁棒性,与相关滤波类算法相比具有更高的跟踪精度,其在VOT2018上期望平均重叠率指标达到0。463,在视频分割任务上也实现了较好结果,DAVIS2016和DAVIS2017上Jaccard指标分别达到77。3和65。3,运行速度达到34 frame/s。实验结果表明,该算法能够准确得到旋转矩形框,对目标进行精准预测,有效解决目标旋转、形变等问题。

    单目标跟踪Transformer注意力机制目标分割形态学方法相关滤波

    基于多跳信息融合的实体对齐模型

    李泽霖吕兆峰陈富强李克...
    142-152页
    查看更多>>摘要:实体对齐是融合不同来源知识图谱的关键步骤。现有的实体对齐方法主要利用结构信息和名称信息,对实体属性值的利用还不够充分,同时在结构利用方面主要利用一阶邻域的结构进行信息的传递,对距离较远的邻居实体的感知能力不足。针对以上问题,提出一种基于多跳信息融合的实体对齐模型。使用预训练语言模型编码属性值信息,在模型的输入中使用实体的名称信息和属性值信息,将其分别输入到2个通道的编码器中进行信息融合,通过多重注意力机制融合不同距离的实体信息,分别计算出不同信息表示下的距离矩阵,对矩阵融合调整后得出最终对齐结果。在原始和降质后的DBP15K数据集上的实验结果表明,所提模型相比现有的各基线模型总体上得到了更精确的对齐结果,其中Hits@1性能比最优模型分别提高了 2。51和5。54个百分点。

    实体对齐知识图谱图神经网络注意力机制知识融合

    基于知识图谱卷积网络的学习资源推荐

    汤志康武毓琦李春英汤庸...
    153-160页
    查看更多>>摘要:针对现有知识图谱卷积网络(KGCN)推荐模型随机采样选择邻域容易导致推荐结果不稳定的缺点,构建基于结构洞和共同邻居的重要性排序采样模型(SHCN),结合KGCN处理高维异构数据的优势,提出基于结构洞和共同邻居的KGCN推荐模型(KGCN-SHCN)。首先使用SHCN模型对知识图谱中的实体邻域进行排序采样,其次根据图卷积网络将实体信息与邻域采样信息进行聚合得到学习资源的特征表示,最后将学习者的特征表示和学习资源的特征表示依据预测函数得到交互概率。在3个学习资源数据集上的实验结果表明,所提模型尤其是使用求和聚合(Sum)方式时,评价指标AUC和ACC总体优于KGCN、RippleNet等基于知识图谱的推荐模型,证明了所提KGCN-SHCN模型的有效性。

    知识图谱图卷积网络图采样推荐算法学习资源

    基于最优近邻的局部保持投影方法

    赵俊涛李陶深卢志翔
    161-168页
    查看更多>>摘要:局部保持投影(LPP)方法是机器学习领域中一种经典的降维方法。然而LPP方法以及部分改进方法在构建数据的局部结构时简单地使用k最近邻(k-NN)分类算法寻找样本的近邻点,容易受到参数k、噪声和异常值的影响。为了解决上述问题,提出一种基于最优近邻的LPP方法。该方法使用寻找最优近邻算法,在找到样本近邻点后,进一步选择与样本有一定数量的共同近邻点的近邻样本作为最优近邻,通过共同近邻点的限定来选择与样本最相似的近邻,增强近邻样本间的相关性,避免了传统LPP方法受参数k影响大等问题。在选择出足够的样本最优近邻后,构建数据局部结构,以便准确地反映数据的本质结构特征,使降维后的数据能最大程度保留样本的有效信息,提升后续机器学习模型的性能。公共图像数据集上的对比实验结果表明,该方法具有较好的数据降维效果,有效地提高了图像识别准确率。

    局部保持投影方法最优近邻近邻样本降维特征提取

    基于MTS-BiGRU-DMHSA的工业负荷预测方法

    王汝英马嘉骏董建强刘万龙...
    169-178页
    查看更多>>摘要:工业用电占我国全社会用电量比重大,通过工业负荷预测了解负荷趋势和用电量信息,有助于电网安全稳定运行,为电力部门发电规划提供依据,且有助于工业用户优化生产工艺和降低成本。为了兼顾工业负荷波动的不确定性以及工业用户用电行为的规律性特征,提出一种基于多时间尺度(MTS)特征的工业负荷预测方法MTS-BiGRU-DMHSA,利用MTS特征融合挖掘工业负荷的周期趋势特征和局部波动特征,提升工业负荷表征的可解释性。此外,双层多头自注意力(DMHSA)机制利用注意力权重聚焦重要特征,在挖掘输入特征关联性的同时捕捉时序关联性,强化重要特征变量与关键时间步的信息表达。在中国某工业企业五面受总柜实采数据上完成实验验证,采用2种评价指标对所提方法及5种基于神经网络的预测方法进行对比分析。实验结果表明,所提方法相较于对比方法平均误差降低逾20%,其中4。67%得益于对MTS特征的运用。通过对比各方法计算效率证实了所提方法的综合性能优势,可视化实验结果与对比分析也验证了其在工业负荷预测任务上的可行性。

    工业负荷预测神经网络多时间尺度特征注意力机制时间序列分析

    基于多级区域选择与跨层特征融合的野生菌分类

    李俊仪李向阳龙朝勋李海燕...
    179-188页
    查看更多>>摘要:近年来误食有毒野生菌导致的中毒事件频发,严重危害人们的身体健康,这使得准确鉴别野生菌变得尤为重要。然而,现有的野生菌分类算法在处理背景噪声大、类间差异小和类内差异大的图片时容易出现识别错误的问题。为了解决这一问题,提出一种基于Vision Transformer(ViT)架构结合多级区域选择和跨层特征融合的野生菌分类算法。该算法旨在捕获具有强鉴别力的特征,以确保网络能够聚焦在主要信息上,并提高分类的准确性。首先采用ViT作为网络框架,以提取野生菌图像的特征和全局上下文信息。其次设计多头自注意力选择模块,用于提取具有鉴别力的token,并通过自适应分配算法为不同层级的编码层确定抽取token的数量。最后为进一步提升分类性能,引入跨层特征融合策略和标签平滑损失进行拟合训练,从而减少细节信息的丢失。为使网络对野生菌图像特征的学习更具针对性,自建野生菌数据集。实验结果表明,所提出的算法与基线算法相比,分类精度有了显著提高,准确率达到98。65%。

    图像分类VisionTransformer架构特征选择自适应分配特征融合标签平滑

    基于UVM的SoC环境中PCIe验证平台设计

    高秋辰胡勇华
    189-196页
    查看更多>>摘要:系统级芯片(SoC)集成多种外设接口,其外设接口的验证工作已经成为芯片开发最耗时的环节之一。PCIe协议为系统内部提供了高速的点对点串行互联服务,同时还支持热插拔和热交换,逐渐成为一种通用的总线协议。使用传统硬件描述语言(HDL)对PCIe接口设计进行验证时,存在短时间内难以覆盖多种设计场景和边界条件,以及验证不完备等问题。为了解决上述问题,利用统一验证方法学(UVM)搭建1个PCIe接口的验证平台。该平台采用UVM定义的框架和测试类,实现了顶层环境集成和测试约束的设计,具有可重用性强和验证全面的特点。实现的内容包括SoC系统级环境集成、待测模块设计与连接、验证平台中sequencer类和monitor类的实现,以及部分接口设计。为了确保测试用例覆盖尽可能多地设计状态和路径,针对性地划分不同功能点,并设计约束条件。通过多种覆盖率指标对测试用例的有效性和覆盖程度进行评估。实验结果表明,该验证平台能缩短验证周期,使综合覆盖率提高30%以上。

    PCIe协议验证平台统一验证方法学覆盖率验证IP

    程序调试中的数据结构演变可视化方法

    苏庆陈建成顾国生刘冬宁...
    197-207页
    查看更多>>摘要:数据结构是程序执行时的重要信息载体,其演变过程往往较为复杂和抽象。针对程序设计初学者较难理解数据结构演变过程的问题,提出一种面向程序调试中的数据结构演变可视化方法。在调试开始时,首先使用组件表达式表示数据结构,然后通过配置表以及布局函数将组件表达式生成可视化视图。在进行单步调试后,通过对比单步调试前后的可视化数据方式生成组件演变行为,运用有限状态机理论构建数据结构演变模型,该模型的执行使得组件发生演变,同时生成可视化动作。使用动画单元执行可视化动作,实现数据结构演变的可视化呈现,帮助初学者理解数据结构相关程序的执行过程。实验结果表明,将该方法应用于1个数据结构演变可视化框架StructV,并应用于1个在线可视化编程实训云平台的研发,可有效降低初学者理解数据结构演变过程的难度,并提升编程实训时的程序调试效率。

    程序调试数据结构可视化组件演变行为有限状态机数据结构演变模型