首页期刊导航|计算机科学
期刊信息/Journal information
计算机科学
计算机科学

朱完元

月刊

1002-137X

jsjkx12@163.com

023-63500828

401121

重庆市渝北区洪湖西路18号

计算机科学/Journal Computer ScienceCSCD北大核心CSTPCD
查看更多>>本刊的读者对象是:大专院校师生,从事计算机科学与技术领域的科研、生产人员。办刊宗旨是:坚持“双百”方针,活跃计算机科学与技术领域的学术气氛,重点报导国内外计算机科学与技术的发展动态,为我国的计算机科学与技术立于世界之林、达到国际先进水平奋斗而矢志不渝。
正式出版
收录年代

    对话场景下的情感引导问题生成模型

    胥备许鹏
    265-272页
    查看更多>>摘要:人机对话系统已在多种智能服务场景中得到广泛应用.当前的人机对话系统可以感知对话者的情感,并根据上下文给出具备特定情感的响应.但是,具备特定情感的响应难以确保能够有效地引导人们产生特定的情感,例如,一个具备"高兴"情感的响应并不能保证人们产生高兴的情感.在一些场景中,人机对话系统需要引导用户达到某种特定的情感状态,以利于对话的持续开展或提升交互效率,如对话心理陪护或在线智能教学.当前的人机对话系统仅针对"积极/消极"等粗粒度情感引导进行了探索,难以应对细粒度情感引导任务.同时,针对对话的心理研究指出,"问题"会显著影响对话方情感的走向.基于上述背景,提出了一种对话场景下的情感引导问题生成模型.该模型基于GPT预训练模型,将需要引导对话方产生的情感作为情感知识引入模型的响应生成过程之中,同时引入了上下文情感感知机制和常识知识融合机制,并采用多任务学习的方法增强了模型的情感感知能力和对话响应生成能力.鉴于这是首次提出面向细粒度情感引导的问题生成任务,因此构建了情感引导数据集用于训练和实验,并且提出了基于提示学习的自动评价方法.最终,自动评价和人工评价的结果表明,所提模型能有效地生成问题,以引导对话方产生特定的情感.

    情感引导问题生成情感对话提示学习多任务学习

    基于预训练模型的多音字消歧方法

    高贝贝张仰森
    273-279页
    查看更多>>摘要:字音转换是中文语音合成系统(Text-To-Speech,TTS)的重要组成部分,其核心问题是多音字消歧,即在若干候选读音中为多音字选择一个正确的发音.现有的方法通常无法充分理解多音字所在词语的语义,且多音字数据集存在分布不均衡的问题.针对以上问题,提出了一种基于预训练模型RoBERTa的多音字消歧方法CLTRoBERTa(Cross-lingual Translation RoBERTa).首先联合跨语言互译模块获得多音字所在词语的另一种语言翻译,并将其作为额外特征输入模型以提升对词语的语义理解,然后使用判别微调中的层级学习率优化策略来适应神经网络不同层之间的学习特性,最后结合样本权重模块以解决多音字数据集的分布不均衡问题.CTLRoBERTa平衡了数据集的不均衡分布带来的性能差异,并且在CPP(Chinese Poly-phone with Pinyin)基准数据集上取得了 99.08%的正确率,性能优于其他基线模型.

    多音字消歧预训练模型字音转换跨语言互译层级学习率样本权重

    基于非欧几何权向量产生策略的分解多目标优化算法

    孙良旭李林林刘国莉
    280-291页
    查看更多>>摘要:随着目标数量的增加,多目标优化问题(Multi Objective Problems,MOPs)的求解越来越困难.基于分解的多目标进化算法表现出更好的性能,但在求解具有复杂Pareto前沿的MOPs时,此类算法易出现种群多样性不足、算法性能下降等问题.为了解决这些问题,提出了一种基于非欧几何权向量产生策略的分解多目标优化算法,通过在非欧几何空间中拟合非支配前沿并进行参数估计,再利用对非支配解目标变量的正态统计采样生成权向量,以此引导种群的进化方向并保持种群的多样性.同时在非欧几何空间中周期性重新确定子问题的邻域,提高分解算法协同进化的效率,进而提高算法的性能.基于MaF基准测试函数的实验结果表明,相比MOEA/D,NSGA-Ⅲ和AR-MOEA算法,所提算法在求解多目标和众目标优化问题方面具有明显的优势.

    分解多目标权向量非支配前沿非欧几何

    基于DGA和稀疏化支持向量机的设备异常诊断

    潘连荣张福泉何井龙杨加意...
    292-297页
    查看更多>>摘要:为了有效提高基于机器学习的设备异常诊断的精度和效率,提出了一种基于稀疏化支持向量机的故障诊断模型.首先,对异常诊断的原理和特征气体进行了分析,给出了故障类型与特征气体的关系;其次,从4个方面对数据进行预处理,包括清洗、归一化、平衡和划分;然后,针对最小二乘支持向量机普遍存在的稀疏性缺乏问题,提出将数据样本映射到高维的核空间,并通过谱聚类算法对映射后的数据进行核空间距离聚类,以实现最小二乘支持向量机的数据预处理,从而实现其稀疏化;最后,在小样本数据集上进行了具体实验分析.结果表明,对于9种类型的故障,与其他基于不同类型支持向量机的诊断模型相比,所提诊断模型仅需11次迭代就可以获得最大适应度值,平均诊断准确率为96.67%,准确率和效率均更高.

    异常诊断机器学习最小二乘支持向量机油中溶解气体分析稀疏化

    云环境中语义感知密文检索研究综述

    刘源龙戴华李张晨周倩...
    298-306页
    查看更多>>摘要:随着云计算、大数据技术的不断发展,数据拥有者愈发倾向于将数据外包给云服务器.为了保证这些数据的安全,许多在云环境下进行的隐私保护密文检索技术被不断提出.但传统的隐私保护检索方案通常没有考虑关键词和文档之间的语义联系.为了解决这个问题,近年来,针对云环境的语义感知密文检索方案成为了研究的热点.针对基于云环境的语义感知密文检索问题,首先展示了现有研究工作主要采用的系统模型、安全模型和检索框架;接着按提取语义的核心技术对现有的语义感知密文检索方案进行分类并分别作研究和综述,阐述其优点与不足;最后,对现有研究工作进行总结,并对该领域未来的研究方向进行探讨.

    云计算隐私保护语义感知关键词检索可搜索加密

    区块链分片技术研究综述

    谭朋柳徐滕涂若欣
    307-320页
    查看更多>>摘要:区块链技术以去中心化、防篡改等功能为特色,具有广泛的应用前景.然而,区块链系统难以支撑大规模海量的分布式数据管理和交易,所以区块链的性能和可扩展性问题成为重要的研究方向.目前,研究人员分别从修改链上的数据结构和共识算法,到添加链下操作技术,提出了一些解决方案,以提高区块链的性能和可扩展性.而其中,随着网络规模的增加,实现水平扩展性的最实用的方法就是分片技术.作为一种链上扩容方式,分片技术是一种将整个区块链网络划分成多个片段的方法,便于同时处理多个交易或合约.每个分片都可以独立运行,拥有自己的交易历史和状态,在不牺牲中心化程度的同时提高了区块链的性能和可扩展性.以往的大量区块链分片技术研究着重介绍了分片中的交易共识,而忽略了分片策略机制与分片架构.为此,首先对现有的分片区块链进行系统分析,将分片区块链的设计过程分为架构设置、节点选择、节点分配、交易分发、交易处理和分片重构等部分,并分析了分片区块链的设计过程的各部分的功能、属性;其次,对分片架构进行了分类和总结,重点研究了各种分片策略与机制,分析了它们的优缺点;之后,对主流的分片区块链系统做了比较,并分析了它们的可扩展性和可靠性,包括系统吞吐量、时延、通信开销、节点随机性、分片安全性和跨片智能合约等;最后,提出未来可能的研究方向.

    区块链分布式账本技术可扩展性分片技术并行处理

    基于知识图谱的网络空间地理图谱构建方法

    吴越胡威李城龙杨家海...
    321-328页
    查看更多>>摘要:在互联网快速发展且网络安全愈发重要的数字信息时代,网络空间地理图谱被认为是认知和管理网络空间的新型手段,其通过综合网络空间和地理空间的信息,能够从多个角度更加全面地展示网络空间态势.但目前对于网络空间地理图谱的研究工作缺乏对网络空间模型细粒度的刻画,也缺乏网络空间地理图谱的具体构建方法和应用方式.针对上述问题,以网络空间认知为目标,文中扩展提出了一个带有时间参考轴的四层四级的网络空间分层模型.此外,为了更好地理解复杂的网络空间环境,还结合知识图谱技术,提出了一个构建网络空间地理图谱的具体框架以及构建网络空间本体的方法.基于Censys的真实测绘数据,成功构建了一个模拟园区网络的网络空间地理图谱原型.本研究提出了对网络空间分层结构的改进方法,同时也将知识图谱引入网络空间地理学的研究领域.这不仅有助于提高对网络空间的理解,而且在网络安全、资源管理、故障恢复、决策制定等方面具有实际的应用意义.

    网络空间地理学知识图谱网络空间层次模型网络空间本体网络空间地理图谱

    基于强化学习的智能化渗透路径规划与求解优化

    李成恩朱东君贺杰彦韩兰胜...
    329-339页
    查看更多>>摘要:在大数据技术广泛应用的背景下,传统渗透测试过于依赖专家经验和人工操作的问题日益显著.自动化渗透测试旨在解决上述问题以达到更准确全面地发现系统安全漏洞的效果,而寻找最优渗透路径是自动化渗透测试中最重要的任务.然而,当前的主流研究试图在包含大量冗余路径的原始解空间中规划最优路径,导致问题的求解复杂度大幅提升;此外,当前研究对漏洞利用和正奖励获取动作的评估不够.通过剔除大量冗余渗透路径,并采取漏洞利用样本增强方法和正奖励样本增强方法,可以简化问题并优化训练过程.基于此,结合解空间转换和样本增强,提出了 MASK-SALT-DQN算法,并定性和定量地分析了该方法对模型求解过程的影响,通过压缩比来衡量解空间转换给模型完成目标所带来的收益.实验表明,原始解空间中冗余解路径的比例始终保持在83%以上,证明了解空间转换的必要性.此外,在标准场景下,理论压缩比为57.2,实验压缩比与理论压缩比的误差仅为1.40%,且相比基线方法,MASK-SALT-DQN在所有实验场景下均有最优的表现,证明了其有效性和先进性.

    渗透路径规划强化学习解空间转换样本增强压缩比

    基于会话统计编码器的恶意加密流量检测方法研究

    巩思越刘辉王宝会
    340-346页
    查看更多>>摘要:随着网络技术的发展和广泛应用,加密流量已成为保护用户隐私的关键技术.但同时,恶意软件和攻击者也利用加密流量来隐藏其行为,规避传统的网络入侵检测系统.现有的恶意加密流量检测方法存在一些问题,如基于统计特征的方法需要依赖专家经验进行特征提取,且不同协议的特征无法通用;基于原始输入的深度学习方法存在信息不完整和字段填充等数据问题,对加密流量交互行为的语义表征不足.为解决上述问题,提出了一种名为会话统计编码器模型(Conversation Statistic En-coder Model,CSEM)的方法.与传统的将字节流输入深度神经网络的模式不同,该方法借鉴了 transformer-encoder模型,引入了一种新的流量包特征解析方式.所提方法能够针对每个流量包构建出固定长度的向量表示,并且无需进行零填充,同时避免了特征提取过程对具体加密协议的依赖,构建了一个混合深度神经网络,为恶意加密流量检测提供了一种新的思路.在Data-Con和自建数据集上对所提模型进行了验证,其在DataCon公开数据集上的召回率达到了 0.991 1,精确率达到了 0.9407,F1值达到了 0.9652(相比随机森林模型F1值提升了 9%),几项指标均达到了目前的最佳水平.

    会话加密流量检测编码器

    一种面向嵌入式设备的动态插桩方法

    司健鹏洪征周振吉陈乾...
    347-355页
    查看更多>>摘要:现有动态插桩方法大多基于x86/x64指令集,对嵌入式设备常用的RISC兼容性较差,且在应用嵌入式设备时存在插桩效率低、资源消耗大等问题.文中提出了一种面向嵌入式设备的动态插桩方法DIEB(Dynamic Instrumentation Method for Embedded Physical Devices).DIEB在嵌入式设备中使用以控制转移指令为探针的探测模式对目标进程进行动态二进制插桩.DIEB提出了一种轻量化的解释执行指令方法,根据指令的运行环境设置指令解释执行区域,并在解释执行区域中解释执行指令获取执行结果.在目标进程动态运行过程中,DIEB通过解释执行用作探针的控制转移指令,获取控制转移指令的目的地址,从而跟踪目标进程的执行流,在软硬件资源紧张的嵌入式设备上高效地进行动态插桩.ARM指令集是一种典型的RISC指令集,测试实验以ARM指令集为验证对象,在NetGear R7000等设备上进行.实验结果表明,经过DIEB插桩的进程可以正常运行,插桩导致的时延远小于基于ptrace的插桩方式,解决了 PIN,Dynamorio等现有动态插桩框架难以在嵌入式设备上运行的问题.此外,DIEB具有在多线程环境下稳定运行的能力,可以准确记录并发线程的执行流轨迹.

    动态二进制插桩指令解释执行嵌入式设备灰盒测试程序运行状态反馈