首页期刊导航|计算机工程
期刊信息/Journal information
计算机工程
华东计算技术研究所 上海市计算机学会
计算机工程

华东计算技术研究所 上海市计算机学会

游小明

月刊

1000-3428

hdsce@sohu265359.sohuvip.net

021-54972331

200233

上海市桂林路418号

计算机工程/Journal Computer EngineeringCSCD北大核心CSTPCD
查看更多>>本刊是中国电子科技集团公司第三十二研究所(华东计算技术研究所)主办的学术性刊物,是上海市计算机学会会刊。主要特点:以最快的速度、科学求实的精神,精选刊登代表计算机行业前沿科研、技术、工程方面的高、精、尖优秀论文。贯彻党的“双百”方针,繁荣科技创作,促进国内外学术交流,探讨和传播计算机科学的理论和实践,加速和促进我国计算机事业的发展。
正式出版
收录年代

    大语言模型在数学推理中的研究进展

    罗焕坤葛一烽刘帅
    1-17页
    查看更多>>摘要:全面概述大语言模型(LLM)在数学推理中的研究进展、机制原理以及应用趋势,为后续开展相关研究提供参考借鉴。选取与大语言模型在数学推理领域相关的122篇文献。系统描述了数学推理问题的类型及其数据集,分别从增强模型推理能力的策略和思维链提示方法这两方面深入解析各技术的原理、应用价值和存在问题。通过定性分析,提出未来可能的研究方向。大语言模型相关研究发展迅速,相关调研工作可能未覆盖完整。基于思维链提示技术、微调、利用编程语言等外部工具、验证机制等方法可以有效提升大语言模型的数学推理能力,特别是基于思维链提示的方法成为当前大语言模型的主要研究热点。未来研究工作可在进一步提升大语言模型的推理能力、提出解决数学推理问题的新方法等方面展开深入研究。

    大语言模型数学推理思维链GPT-4微调

    文本相似度计算方法综述

    魏嵬丁香香郭梦星杨钊...
    18-32页
    查看更多>>摘要:文本相似度计算是自然语言处理的一部分,用来计算两个词、句子及文本之间的相似程度,具有多种应用场景,文本相似度计算的研究对于人工智能的发展有着重要作用。文本相似度计算起初基于字符串表面,随着词向量的提出,文本相似度计算可进行基于统计以及深度学习的建模与计算,也可与预训练模型相结合。首先,将文本相似度计算方法分为基于字符串、基于词向量、基于预训练模型、基于深度学习、其他方法5类,并对这些方法进行简要介绍。然后,根据不同文本相似度计算方法的原理,具体介绍了编辑距离、汉明距离、词袋模型、向量空间模型(VSM)、深度结构语义模型(DSSM)、句子嵌入的简单对比学习(SimCSE)等常见方法。最后,对文本相似度计算常用的数据集以及评价标准进行整理和分析,并对文本相似度计算的未来发展进行展望。

    文本相似度字符串词向量预训练模型深度学习

    基于Swin Transformer的双流遥感图像时空融合超分辨率重建

    王志浩钱沄涛
    33-45页
    查看更多>>摘要:遥感图像时空融合超分辨重建从高时序密度的低分辨率图像和低时序密度的高分辨率图像中提取信息,生成同时具有高时序密度的高分辨率遥感图像,它直接关系到后续的解译、检测、跟踪等任务的实施。随着卷积神经网络(CNN)的快速发展,研究者们提出了一系列基于CNN的时空融合方法,然而由于卷积的局限性,这些方法在全局信息提取方面仍然存在不足。受Swin Transformer全局能力的启发,提出一种基于Swin Transformer的超分辨重建模型。在特征提取阶段,引入双流结构,将特征提取网络分为两个部分,分别提取时间信息与空间信息,并通过Swin Transformer的全局能力提升模型性能。在特征融合阶段,引入结合通道注意力与空间注意力的卷积块注意力模块(CBAM),用于增强重要特征,提升图像重建精度。在Coleambally灌溉区(CIA)与Gwydir下游流域(LGC)数据集上将该模型与多种时空融合超分辨率重建模型进行对比实验,结果表明该模型在各项评价指标上均取得了最优的结果,具有更出色的性能和更强的泛化能力。

    时空融合超分辨率重建SwinTransformer算法双流结构卷积神经网络

    基于生物入侵的特征选择算法

    张健张博
    46-53页
    查看更多>>摘要:在自然界中,生物入侵以其发展的迅速和巨大的生态影响而受到关注,所引入种群对合适栖息地的寻找过程往往有其内在的逻辑,种群之间的交流和种群的扩张也在这个过程中起到了重要作用。通过探究种群对适宜栖息地的寻找原理,提出一种基于生物入侵的特征选择(BIAFS)算法。在BIAFS算法中,生物入侵过程分为种群建立、种群迁移、种群交流和扩张、种群发展4个阶段。在实验验证过程中,在9个数据集上将BIAFS算法与8种高性能算法进行实验比较。实验结果显示,BIAFS算法在7个数据集上的分类准确率(CA)和降维(DR)率均超过了对比算法。此外,适应度标准偏差的比较实验也证实了 BIAFS算法的高稳定性,表明其在多个数据集上能更加稳健地寻找最优解。上述实验结果证明了 BIAFS算法在特征选择任务中的有效性和优越性。

    生物入侵特征选择入侵动态差分进化精英策略

    面向磁浮轨道的多源点云数据的混合滤波方法

    张玉鑫张雷欧冬秀
    54-62页
    查看更多>>摘要:在磁浮轨道的仿真数据处理过程中,磁浮轨道点云数据的滤波提取是重要环节之一,实际应用应根据待提取的磁浮数据特性,采用高效的滤波方法。磁浮轨道的点云数据对象主要包括由无人机(UAV)倾斜摄影获取的磁浮轨道的图像数据并经过三维重建后形成的稠密点云数据、由手持式激光雷达扫描磁浮轨道获取的激光点云数据。根据这两种点云的数据特性,考虑磁浮轨道四周复杂场景的点云环境,分别对两种点云进行混合滤波。首先,对激光点云数据采用八叉树下采样方法,有效降低了点云数据的数量级,节省了运行时间。然后,分别对激光点云与稠密点云数据采用布料模拟滤波(CSF)方法,过滤了地平面点云数据,保留了非地面点云数据;采用统计离群点去除(SOR)滤波方法,筛除了大量离群点;根据磁浮轨道特征,采用直通滤波过滤了坐标范围外的点云数据。实验结果表明,在不影响磁浮轨道结构的前提下,对于采用八叉树下采样方法的激光点云数据和没有采用八叉树下采样的稠密点云数据,该方法的滤波率分别为86。15%和64。76%,经混合滤波后的两种点云数据的结构近似,点云数量处于同一数量级,为磁浮轨道点云特征提取等后续任务提供了有效保障。

    磁浮轨道多源点云数据八叉树下采样布料模拟滤波统计离群点去除滤波

    面向行政执法案件文本的事件抽取研究

    屈潇雅李兵温立强
    63-71页
    查看更多>>摘要:行政执法的智能化水平是国家治理能力现代化的体现,数据是智能化发展的重要依托。在行政执法领域,各行政机关存储大量以文本形式记录的历史案件,这种非结构化的数据价值密度较低、可利用性不强。利用事件抽取技术从行政执法案件文本中快速高效地抽取案件职权类型、案发时间、案发地点等结构化信息,可推动行政机关对历史案件信息的利用和智能化执法办案研究。收集整理某城市的真实案例数据,并通过人工标注构建一个行政执法领域的数据集,根据行政执法案件文本的无触发词、文档级、格式不固定等文本特征,提出结合基于Transformer的双向编码器表示(BERT)和基于条件随机场的双向长短期记忆网络(BiLSTM-CRF)模型的两阶段事件抽取方法,通过文本多分类和序列标注依次完成事件类型检测和事件论元抽取任务。实验结果表明,事件类型检测任务的F1值达到99。54%,事件论元抽取任务的F1值达到97。36%,实现了对案件信息的有效抽取。

    行政执法案件事件抽取两阶段方法基于Transformer的双向编码器表示模型基于条件随机场的双向长短期记忆网络(BiLSTM-CRF)模型

    基于自蒸馏框架的点云分类及其鲁棒性研究

    李维刚厉许昌田志强李金灵...
    72-81页
    查看更多>>摘要:与2D图像数据集相比,3D点云数据集的规模较小且表征性较差,容易导致神经网络出现过拟合和泛化能力差的问题。为此,提出一种点云自蒸馏(PointSD)框架,通过对表征形式不同的数据样本进行学习,使网络提取到原始点云数据中的更多特征信息,实现样本之间的知识交互,在不增加额外计算负荷的情况下提升网络的泛化能力,适用于不同规模的分类网络模型。基于该框架提出一种点云抗腐败训练方法TND-PointSD,解决了当前点云训练方法抗腐败能力不足的问题。实验结果表明:在ScanObjectNN数据集上,应用PointSD框架的PointNet++和RepSurf-U‡2X基准网络的平均准确率(MA)相比于应用标准训练(ST)方法提高了 8。22和4。86个百分点;在ModelNet40-C数据集上,在15种腐败类型上分类网络的平均整体准确率(MOA)均有所提升,证明了 TND-PointSD方法能够有效地增强网络模型的腐败鲁棒性。

    点云数据点云分类自蒸馏数据增强腐败鲁棒性

    基于Kubernetes的集群节能策略研究

    李俊俊董建刚李坤
    82-91页
    查看更多>>摘要:在Kubernetes中,HPA具备自动扩展Pod的能力,它可以根据流量的波动情况,在高峰时增加Pod数量以应对需求,而在低谷时减少数量以节省资源。然而,由于HPA是根据当前Pod的性能指标来进行扩展的,当流量激增时,可能会对应用服务的可用性产生不利影响,并且当压力较小时,算力资源的空载会导致电子资源的浪费。针对上述问题,研究并验证一种基于时序预测的集群资源自动缩放与智能休眠唤醒策略,使用GC-TimesNet模型对集群资源的使用情况进行预测。当资源利用率较低时,计算出需要关闭的算力节点数量,将这些节点设置为不可调度状态,并驱逐节点现有的Pod,然后将这些机器置于睡眠状态。相反,当资源需求增加时,会唤醒足够数量的机器,并通过HPA控制器增加所需数量的Pod副本。实验结果表明,该策略能够较为准确地预测集群负载的变化趋势,结合实施智能的休眠与唤醒策略,提升优化集群的运维管理能力,最大程度地提高计算资源的利用率,为降低集群能源开销提供数据支撑,实现节能减排。

    Kubernetes工具容器编排集群节能时间序列预测GC-TimesNet模型卷积神经网络注意力机制节能减排

    类不平衡的特征演化流在线学习方法

    陈燕菲刘三民
    92-103页
    查看更多>>摘要:特征演化流是指特征空间以任意形式动态变化的数据流,其中同时存在数据类别分布不平衡的现象,这给数据流分类任务带来巨大挑战。在线学习是数据流挖掘的有效工具之一,但目前鲜有在线学习框架可同时处理数据流中特征演化和类不平衡问题。因此,提出一种类不平衡的特征演化流在线学习方法。首先,对实例特征进行划分,并将分类器分别投影至对应特征空间,结合在线被动-主动算法分别训练不同特征空间下的分类器;然后,将代价敏感指标最小化问题融入模型在线优化目标函数中,根据不平衡率定义新的代价敏感因子,动态调整类别权重以解决类不平衡问题;最后,为提高分类器泛化性能,利用变异系数筛选出重要特征,从而对分类器稀疏截断处理。大量仿真实验结果表明,该方法在11个UCI数据集上均获得较高的准确率、几何均值和马修斯相关系数,分别平均提升约0。021、0。058和0。072,验证了所提方法对特征演化流具有良好的自适应能力,同时能有效处理特征演化流中的类不平衡问题。

    数据流挖掘特征演化类不平衡在线学习代价敏感学习

    面向不平衡数据的机械设备故障命名实体识别

    党小超刘涧董晓辉祝忠彦...
    104-112页
    查看更多>>摘要:命名实体识别作为构建知识图谱的基础任务,其识别效果直接影响知识图谱的质量。在实际生产中,机械故障数据通常包含大量的领域专业词汇,同时实体类型普遍存在分布不平衡的问题,这对准确识别故障实体构成了挑战。通用领域实体识别方法在这一领域效果欠佳,从而降低了知识图谱的质量。为应对上述问题,提出一种融合焦点损失(Focal Loss)函数和专业词典的实体识别方法。该方法使用Focal Loss函数应对实体类型不平衡问题,通过引入平衡因子和调制系数,改进传统的交叉熵损失函数,提升实体识别效果,同时将领域专业词汇嵌入到模型中,进一步提高实体识别性能,这一词典包含机械故障的领域术语,有助于模型更准确地识别机械设备故障命名实体。在自建的矿井提升机实验数据集上进行广泛实验验证,结果证明,融入Focal Loss后模型的F1值比主流模型BERT-BiLSTM-CRF提高了 5。57个百分点,相比用于解决数据不平衡的典型方法SMOTE效果更优,在此基础上,通过嵌入领域词典,模型的F1值得到进一步提升,达到89。13%。

    命名实体识别不平衡数据焦点损失函数机械设备故障双向长短期记忆网络条件随机场