首页期刊导航|计算机工程
期刊信息/Journal information
计算机工程
华东计算技术研究所 上海市计算机学会
计算机工程

华东计算技术研究所 上海市计算机学会

游小明

月刊

1000-3428

hdsce@sohu265359.sohuvip.net

021-54972331

200233

上海市桂林路418号

计算机工程/Journal Computer EngineeringCSCD北大核心CSTPCD
查看更多>>本刊是中国电子科技集团公司第三十二研究所(华东计算技术研究所)主办的学术性刊物,是上海市计算机学会会刊。主要特点:以最快的速度、科学求实的精神,精选刊登代表计算机行业前沿科研、技术、工程方面的高、精、尖优秀论文。贯彻党的“双百”方针,繁荣科技创作,促进国内外学术交流,探讨和传播计算机科学的理论和实践,加速和促进我国计算机事业的发展。
正式出版
收录年代

    专有名词增强的复述生成方法研究

    张雪陈钰枫徐金安田凤占...
    98-105页
    查看更多>>摘要:现有的中文复述生成模型在对包含专有名词的原句生成复述句时经常丢失原句中的专有名词,造成复述句的语义偏移,降低复述句的可用性,进而影响其在下游任务中的应用效果。为了解决这类问题,提出专有名词增强的复述生成方法。针对包含单个专有名词的原句构建基于占位符的复述生成模型,通过将训练句对中的专有名词用占位符替换,训练模型对占位符的保留能力;针对包含多个专有名词的原句构建词汇约束的复述生成模型,通过将专有名词列表与原句拼接并进行区分,训练模型对多个专有名词的识别和复制能力,提高复述句对专有名词的保留率。此外,综合考虑语义一致性和表达多样性,提出参考句无关的复述句质量评价指标用来评估生成复述句的质量。以真实对话系统业务中的意图识别冷启动任务为下游任务,对比不同模型生成复述句的质量以及在意图识别任务上的准确率。实验结果表明,词汇约束的复述生成模型能够生成与原句语义一致且表达具有多样性的高质量复述语料,对应语料训练得到的意图识别模型准确率最高,相较于未考虑专有名词的复述模型,意图识别模型的准确率提高了5。38%。

    复述生成语义偏移占位符词汇约束意图识别

    基于多尺度LDTW和TCN的空间负荷预测方法

    马越温蜜
    106-113页
    查看更多>>摘要:空间负荷预测为合理建设和使用变电站、馈线等提供了重要的指导,成为配电网规划中不可或缺的一部分。配电网规划的精细化产生了大量高分辨率的负荷数据,社会的快速发展使得地块的用电特征日趋复杂。当前的空间负荷预测没有充分考虑负荷数据之间的时间特性,且在预测过程中也未考虑到不同类型地块间可能存在的负荷峰值出现时间不一致问题。为此,提出一种空间负荷预测方法,通过基于多尺度限制对齐路径长度(LDTW)的谱聚类分析用户的负荷曲线在形状上的相似性,并提取不同地块的典型用电行为,以进一步分类确定同类型地块对应的同时率。多尺度LDTW通过限制序列之间匹配步长的上限来抑制病态匹配的产生,提高曲线相似性的综合评估能力。根据聚类结果筛选适合待预测区域的训练样本并构建基于时间卷积网络(TCN)的回归预测模型,将预测结果基于地块各自的同时率进行聚合,实现空间负荷预测。实验结果表明:该方法加强了对负荷曲线形状的分析和对不同类型地块同时率的区分,在聚类方面,DBI指数达到0。57,VI指数达到0。31;在预测方面,相对误差达到1。93%,决定系数达到0。941,相比其他典型方法均取得了较大改善。

    空间负荷预测动态时间规整谱聚类同时率时间卷积网络

    多率采样机制下多智能体动态事件触发二分一致性研究

    范晓宇贾新春李彬谢云飞...
    114-121页
    查看更多>>摘要:针对满足细节平衡结构的对抗交互多智能体系统,研究多率采样机制下其动态事件触发二分一致性问题。在多率采样机制下,通过构造一个多率缓存器解决多率采样时序不匹配的问题,设计一类多率观测器便于获得系统的估计状态以实现目标控制。通过引入动态事件触发机制,多率观测器在事件触发时刻广播其状态数据至通信网络中的邻居智能体。每个智能体基于触发时刻的观测器状态信息,利用一组开环估计器以获得连续的智能体状态估计值。在此基础上,设计一个分布式控制协议,利用代数黎卡提方程和李雅普诺夫稳定性理论证明系统可以在细节平衡的多智能体系统通信网络中实现二分一致性,并且排除动态事件触发可能导致的芝诺行为。通过一个包含3种不同采样机制和控制方案的对比仿真,证明了所提控制方案的有效性,表明多率采样机制相较于传统的单率采样机制具有更快和更稳定的收敛性能,并且动态事件触发相较于静态事件触发可以进一步降低触发次数。

    多智能体系统多率采样机制二分一致性动态事件触发机制细节平衡结构

    基于混合平衡优化算法的疫苗配送路径优化

    陈娟倪志伟李华
    122-130页
    查看更多>>摘要:针对疫苗配送路径优化问题,在同时考虑固定成本、运输成本、制冷成本、碳排放成本和惩罚成本的情况下,提出以疫苗配送成本最小化为目标的车辆路径优化模型。为求解模型,在平衡优化器算法中引入模拟退火算法,改进平衡优化器算法容易陷入局部最优的不足,通过加入可变参数,提升算法平衡全局搜索和局部寻优的能力,得到一个能够稳定求出较高质量解的混合平衡优化算法。对2种不同规模的算例分别进行20次实验,将混合平衡优化算法与并行平衡优化算法、知识型蚁群算法、混合变邻域搜索算法、改进混合粒子群算法和平衡优化器算法进行对比。实验结果表明,混合平衡优化算法在小规模算例和大规模算例下得到的最小配送成本和配送成本的标准差都小于其他5种算法,其中,在小规模算例下进行实验后得到的最小配送成本分别为其他5种算法的73。5%、53。9%、69。1%、64。1%和33。4%。

    疫苗冷链配送车辆路径优化资源满意度惩罚函数混合平衡优化算法

    基于因果自回归流模型的因果结构学习算法

    卢小金陈薇郝志峰蔡瑞初...
    131-136页
    查看更多>>摘要:因果自回归流模型已经在非独立噪声等场景的因果方向推断问题上取得了一定的进展,但在多个结点的场景下仍存在全局结构搜索带来的准确度低和计算时间复杂度高的问题。面向非时序观察数据设计一种两阶段因果结构学习算法。在第一阶段,基于观测数据的条件独立性,对完全无向图通过条件独立性检验得到基本的因果骨架;在第二阶段,基于因果自回归流模型,通过标准化流的方法计算骨架中每条无向边在不同方向上的边缘似然概率,进而通过比较边缘似然概率进行因果方向推断。实验结果表明:该算法在多组不同参数生成的仿真因果结构数据集上均有较好的表现,与现有的主流因果结构学习算法相比,F1值平均提升15%~28%;在真实因果结构数据集实验中,该算法能够较为完整准确地学习到变量间的因果关系,与主流的因果结构学习算法相比,F1值平均提升28%~48%,具有更强的鲁棒性。

    因果结构学习因果发现加性噪声模型因果自回归流模型标准化流

    自适应节点规模的区块链分片可扩展模型

    李宝莹李志淮王成爱杨锋...
    137-147页
    查看更多>>摘要:分片是解决区块链可扩展性问题的核心技术,然而现有分片方案普遍采用预定分片规模的静态分片方式,这与公链开放低门槛的分布式环境不匹配。当网络中的节点数大幅增加时静态分片方式难以及时充分地发挥全部节点的性能,当网络中的节点数大幅减少时又会增加分片内的安全隐患。为此,构建一种自适应节点规模变化的动态分片可扩展模型(DSSM)。在基础分片上建立分层的逻辑分片,通过支持状态归约允许节点在不同层级的分片上进行状态同步。在逻辑与基础分片间建立满二叉树的逻辑关系,通过分片的动态分裂和合并来扩张和收缩分片规模,实现分片规模的自适应调整。实验结果表明,DSSM在节点数量大幅增加时通过自适应扩展分片规模使网络吞吐量得到了近乎翻倍的提升,在节点数量大幅减少时通过自适应收缩分片规模保证了网络的最低安全要求。

    区块链自适应节点规模状态分片归约节点状态冗余

    云-边融合的可验证隐私保护跨域联邦学习方案

    张晓均李兴鹏唐伟郝云溥...
    148-155页
    查看更多>>摘要:联邦学习技术的飞速发展促进不同终端用户数据协同训练梯度模型,其显著特征是训练数据集不离开本地设备,只有梯度模型在本地进行更新并共享,使边缘服务器生成全局梯度模型。然而,本地设备间的异构性会影响训练性能,且共享梯度模型更新具有隐私泄密与恶意篡改威胁。提出云-边融合的可验证隐私保护跨域联邦学习方案。在方案中,终端用户利用单掩码盲化技术保护数据隐私,利用基于向量内积的签名算法产生梯度模型的签名,边缘服务器通过盲化技术聚合隐私数据并产生去盲化聚合签名,确保全局梯度模型更新与共享过程的不可篡改性。采用多区域权重转发技术解决异构网络中设备计算资源与通信开销受限的问题。实验结果表明,该方案能够安全高效地部署在异构网络中,并在MNIST、SVHN、CIFAR-10和CIFAR-1004个基准数据集上进行系统实验仿真,与经典联邦学习方案相比,在精度相当的情况下,本文方案梯度模型收敛速度平均提高了21。6%。

    联邦学习全局梯度模型数据隐私可验证隐私保护跨域训练

    基于角度的图神经网络高维数据异常检测方法

    王俊赖会霞万玥张仕...
    156-165页
    查看更多>>摘要:在高维数据空间中,数据大都处于高维空间边缘且分布十分稀疏,由此引起的"维度灾难"问题导致现有异常检测方法无法保证异常检测精度。为解决该问题,提出一种基于角度的图神经网络高维数据异常检测方法A-GNN。首先通过数据空间的均匀采样和初始训练数据的扰动来扩充用于训练的数据;然后利用k近邻关系构造训练数据的k近邻关系图,并以k近邻元素距离加权角度的方差作为近邻关系图节点的初始异常因子;最后通过训练图神经网络模型,实现节点间的信息交互,使得相邻节点能够互相学习,从而进行有效的异常评估。在6个自然数据集上将A-GNN方法与9种典型异常检测方法进行实验对比,结果表明:A-GNN在5个数据集中取得了最高的AUC值,其能够大幅提升各种维度数据的异常检测精度,在一些"真高维数据"上异常检测的AUC值提升达40%以上;在不同k值下与3种基于k近邻的异常检测方法相比,A-GNN利用图神经网络节点间的信息交互能有效避免k值对检测结果的影响,方法具有更强的鲁棒性。

    异常检测基于角度的异常评估图神经网络高维数据k近邻

    非独立同分布场景下的联邦学习优化方法

    宋华伟李升起万方杰卫玉萍...
    166-172页
    查看更多>>摘要:联邦学习能够在不泄露数据隐私的情况下合作训练全局模型,但这种协作式的训练方式在现实环境下面临参与方数据非独立同分布(Non-IID)的挑战:模型收敛慢、精度降低的问题。许多现有的联邦学习方法仅从全局模型聚合和本地客户端更新中的一个角度进行改进,难免会引发另一角度带来的影响,降低全局模型的质量。提出一种分层持续学习的联邦学习优化方法(FedMas)。FedMas基于分层融合的思想,首先,采用客户端分层策略,利用DBSCAN算法将相似数据分布的客户端划分到不同的层中,每次仅挑选某个层的部分客户端进行训练,避免服务器端全局模型聚合时因数据分布不同产生的权重分歧现象;进一步,由于每个层的数据分布不同,客户端在局部更新时结合持续学习灾难性遗忘的解决方案,有效地融合不同层客户端数据间的差异性,从而保证全局模型的性能。在MNIST和CIFAR-10标准数据集上的实验结果表明,FedMas与FedProx、Scaffold和FedCurv联邦学习算法相比,全局模型测试准确率平均提高0。3~2。2个百分点。

    联邦学习持续学习数据异构聚类分层优化数据分布

    基于v3洋葱域名的比特币地址威胁程度分析

    胡锦枫徐晓瑀陈云芳张伟...
    173-181页
    查看更多>>摘要:比特币可以在不透露使用者身份的情况下进行交换,导致其成为不法分子在暗网上进行违法活动的主要方式。为了追踪比特币非法交易,传统方法根据比特币的伪匿名性,在整个区块链上进行启发式地址聚类,没有充分利用比特币地址在暗网上的信息。2021年Tor官方全面启用v3洋葱域名,使得以往的v2洋葱域名数据无法再作为分析的依据。设计并实现基于v3洋葱域名的比特币地址威胁程度的一体化分析框架TLAFDB。信息收集模块使用境外服务器解决地域限制并设置socks5h代理以支持暗网爬虫运行,使用洋葱种子地址在暗网中爬行收集最新的v3洋葱域名数据,信息清洗模块采用可同时覆盖Base58和Bech32编码的正则表达式以提取v3洋葱域名网页中的比特币地址,通过区块链搜索引擎Blockchain。com筛选存在真实交易的比特币地址,并建立其和所在v3洋葱域名的关联关系,信息分析模块采用人工分析和关键词匹配相结合的方法分类v3洋葱域名,赋予其关联的比特币地址类别和流行度并判定威胁程度。实验结果表明,TLAFDB收集了23627个v3洋葱域名网页,提取并分析1141个存在真实交易的比特币地址的类别、流行度和威胁程度,发现在暗网中同一个比特币地址常出现在大量的镜像洋葱域名网页上,超过95%的比特币地址被恶意使用,并且庞氏骗局交易量占高危比特币地址总交易量的99%。

    暗网爬虫v3洋葱域名比特币地址分类