首页期刊导航|计算机科学
期刊信息/Journal information
计算机科学
计算机科学

朱完元

月刊

1002-137X

jsjkx12@163.com

023-63500828

401121

重庆市渝北区洪湖西路18号

计算机科学/Journal Computer ScienceCSCD北大核心CSTPCD
查看更多>>本刊的读者对象是:大专院校师生,从事计算机科学与技术领域的科研、生产人员。办刊宗旨是:坚持“双百”方针,活跃计算机科学与技术领域的学术气氛,重点报导国内外计算机科学与技术的发展动态,为我国的计算机科学与技术立于世界之林、达到国际先进水平奋斗而矢志不渝。
正式出版
收录年代

    基于不确定性权重的保守Q学习离线强化学习算法

    王天久刘全乌兰
    265-272页
    查看更多>>摘要:离线强化学习(Offline RL)中,智能体不与环境交互而是从一个固定的数据集中获得数据进行学习,这是强化学习领域研究的一个热点.目前多数离线强化学习算法对策略训练过程进行保守正则化处理,训练策略倾向于选择存在于数据集中的动作,从而解决离线强化学习中对数据集分布外(OOD)的状态-动作价值估值错误的问题.保守Q学习算法(CQL)通过值函数正则赋予分布外状态-动作较低的价值来避免该问题.然而,由于该算法正则化过于保守,数据集内的分布内状态-动作也被赋予了较低的价值,难以达到训练策略选择数据集中动作的目的,因此很难学习到最优策略.针对该问题,提出了一种基于不确定性权重的保守Q学习算法(UWCQL).该方法引入不确定性计算,在保守Q学习算法的基础上添加不确定性权重,对不确定性高的动作给予更高的保守权重,使得策略能更合理地选择数据集分布内的状态-动作.将UWCQL算法应用于D4RL的MuJoCo数据集中进行了实验,实验结果表明,UWCQL算法具有更好的性能表现,从而验证了算法的有效性.

    离线强化学习深度强化学习强化学习保守Q学习不确定性

    2024"科创中国"科技服务团项目,CCF入选两项

    CCF微信公众号
    272页

    基于分阶段自编码器与注意力机制的舰载机着舰航迹实时预测模型

    李哲刘奕阳王可杨杰...
    273-282页
    查看更多>>摘要:航空母舰舰载机着舰过程中应沿相对固定的航迹下滑,以保证触舰点位于舰艉拦阻系统所在的区域,因此舰载机航迹是着舰信号官进行指挥决策的重要依据之一.舰载机航迹实时预测有助于着舰信号官判断着舰作业发展态势,及时形成正确的航迹纠偏引导指令.为此,提出一种基于分阶段自编码器与注意力机制的着舰航迹实时预测模型.第一阶段采用降噪自编码器对历史航迹数据进行特征提取;第二阶段基于长短期记忆网络构建时序自编码器,同时引入注意力机制对不同时刻的编码器输出分配不同的权重,自适应学习其对最终预测结果的影响强度.通过仿真实验将所提模型与6种基线模型进行对比,结果表明,所提模型的综合性能优于基线模型,能够满足着舰航迹实时准确预测的应用需求.

    舰载机着舰航迹预测长短期记忆网络自编码器注意力机制

    图灵奖获得者JOHN HOPCROFT教授将出席CNCC2024作特邀报告

    CCF微信公众号
    282页

    基于离散变邻域蜉蝣优化的装配作业车间调度算法

    陈雅莉潘友林刘耿耿
    283-289页
    查看更多>>摘要:由于受到疫情影响,企业迫切地需要通过升级改造自动化柔性生产线来实现降本增效.在这一背景下,装配作业车间调度问题(Assembly Job Shop Scheduling Problem,AJSSP)再一次成为学术界和企业界的研究热点.AJSSP比普通作业车间调度问题多了 一道装配阶段,故其存在前后工序相互制约和多机并行现象,问题求解也更加复杂.针对该问题,提出了 一种基于离散变邻域蜉蝣优化算法(Discrete Variable Neighborhood Mayfly Algorithm,D-VNMA)的调度方法,主要工作如下:1)采用符合Lamarkian特性的编码解码机制,实现个体有效信息的迭代继承;2)使用Circle映射融合常见启发式算法初始化蜉蝣种群,保证种群的多样性;3)加入新的邻域探索策略,采用多种不同的邻域结构和搜索策略的差异组合,增加搜索方案的多样性,提高寻找局部最优解的搜索效率;4)提出改进的雌雄蜉蝣交配策略,提高算法全局探索能力,加快算法整体收敛速度.在实验过程中,通过试验设计(Design of Experiment,DOE)方法获得D-VNMA的最佳参数设置,并在不同规格AJSSP算例数据上将D-VNMA和其他算法进行比较.实验结果表明,D-VNMA得到最优解的概率提升了 30%,且收敛效率最高可提升62.15%.

    装配作业车间车间调度蜉蝣优化算法Circle映射邻域搜索

    考虑无人艇运动学约束的IRRT*-APF路径规划算法

    刘意齐洁
    290-298页
    查看更多>>摘要:针对未知环境下无人艇(USV)的路径规划问题,提出了 一种考虑无人艇运动学约束的改进RRT*-APF路径规划算法(IRRT*-APF).通过引入改进的人工势场法(APF)提高了快速搜索随机树(RRT*)的避障性能,在人工势场中考虑无人艇与障碍物和目标点间的角度大小,加速了无人艇远离障碍物并接近目标点;使用曼哈顿距离法提高了 RRT*算法的效率.所提出的IRRT*-APF方法,与滚动RRT*算法和PSOFS算法进行了仿真对比实验.结果表明,提出的方法所规划的路径转折的次数和转角均显著减小,有利于实现无人艇的平稳控制,同时缩短了路径长度和规划路径的时间.在风浪环境下的进一步仿真实验结果表明,所提出的算法在有风浪干扰时依然能规划出符合无人艇运动学的轨迹,具有较强的抗风浪鲁棒性.

    无人艇快速扩展随机树人工势场法局部路径规划滚动窗口

    基于时空间联合去噪的改进差分进化算法

    王彬张鑫雨金海燕
    299-309页
    查看更多>>摘要:在工程问题的优化求解过程中,对个体的适应度评价可能会受到环境噪声的干扰,进而影响对种群进行合理的优胜劣汰操作,造成算法性能下降.为了对抗噪声环境的影响,提出了一种基于时空间联合去噪的改进差分进化算法(SEDADE).根据适应度排名将种群划分成两个子种群,对评价较差个体组成的子种群用分布估计算法(EDA)进化,采用高斯分布建模解空间,利用解空间中多个个体噪声的随机性抵消噪声影响;对评价较好个体组成的子种群用差分进化算法(DE)进化,并且引入基于时间的停滞重采样机制去噪,提高收敛精度.对时空间混合进化得到的两个子种群进行基于概率选择的EDA信息利用操作,利用EDA搜索得到的全局信息引导DE的搜索方向,避免陷入局部最优.在实验中使用了被零均值高斯噪声干扰的基准函数,可以发现SEDADE相比其他算法更具有竞争性,此外通过消融实验验证了所提算法包含的3个机制的有效性和合理性.

    差分进化分布估计噪声重采样混合进化信息利用

    CCSD:面向话题的讽刺识别方法

    刘其龙李弼程黄志勇
    310-318页
    查看更多>>摘要:随着社交媒体的发展,越来越多的人在社交平台上发表对热点话题的看法,其中讽刺手法的运用严重影响了社交媒体中情感分析的精度.目前面向话题的讽刺识别研究未同时考虑上下文和常识知识的作用,也忽略了在同一个话题下进行讽刺识别的场景.为此,提出了基 于上下文和常识的 讽刺识别模型(Sarcasm Detection with Context and Common Sense,CCSD).首先,模型使用C3KG常识库生成常识文本,并将目标句、话题上下文和常识文本作为预训练BERT模型的输入.其次,使用注意力机制来关注目标句和常识中重要的信息.最后,通过门控机制和特征融合,实现讽刺识别.文中构建了一个面向话题的讽刺识别数据集,以验证模型在特定话题中的有效性.实验结果表明,相比基线模型,新模型的性能更优.

    讽刺识别面向话题的讽刺识别上下文常识知识注意力机制

    面向多目标状态感知的自适应云边协同调度研究

    周文晖彭清桦谢磊
    319-330页
    查看更多>>摘要:随着智能城市和工业智能制造的蓬勃发展,从监控摄像头获取详尽信息以进行多目标视觉分析的需求日益突出.现有研究主要关注在服务器上进行资源调度以及改良视觉模型,往往不能很好地应对设备资源状态和任务状态的动态变化.随着边缘端硬件资源的升级和任务处理模型的改进,设计一个自适应的云边协同调度模型来满足任务的实时用户需求成为优化多目标状态感知任务的重要方式.因此,在深入分析云边场景下多目标状态感知任务特性的基础上,提出了一种基于深度强化学习的自适应云边协同调度模型ATS-SAC.ATS-SAC通过实时解析多目标状态感知任务的运行时状态,动态给出任务执行的视频流配置、模型部署配置等调度决策,从而显著优化环境不稳定的云边场景下多目标状态感知任务的精度、时延的综合性能质量.同时,还引入了一种基于用户体验极限阈值的动作筛选方法,有助于去除冗余的决策动作,进一步优化模型的决策空间.针对用户对多目标状态感知任务性能结果的不同需求,ATS-SAC模型能提供包括极速模式、均衡模式和精度模式在内的多种灵活的调度策略.实验结果表明,相比其他的任务执行方式,在ATS-SAC模型的调度策略下,多目标状态感知任务在精度质量和处理时延上更能满足用户的体验需求.同时,当实时运行状态变化时,ATS-SAC模型能够动态调整其调度策略,以保持稳定的任务处理效果.

    边缘计算云边协同调度策略多目标状态感知深度强化学习

    面向轨道交通智能故障检测的边云计算方法

    李志林森张强
    331-337页
    查看更多>>摘要:轨道交通系统是当今社会中交通运力的主要承载系统,对安全性有极高的要求.轨道交通系统的多个组件由于直接暴露在环境中,受多种外界因素影响,易出现故障.这些故障可能会导致列车延误、乘客滞留、服务暂停,甚至是灾难性的生命或资产损失.因此,需要设计针对轨道交通系统的实时故障检测方案,进而才能采取有效的维护措施.不同于基于传统的机器学习(Machine Learning,ML)的故障检测工作,本研究采用中文双 向编码 器表示转换器(Bidirectional Encoder Representation from Transformer,BERT)深度学习(Deep Learing,DL)模型进行实时的智能故障检测.该模型能够在处理故障检测任务时获取双向上下文的理解,从而更准确地捕捉句子中的语义关系,使得其对故障描述的理解更为精准.BERT的训练需要大量的数据支持,而轨道交通领域中存在多个运营商,它们各自持有独立的故障检测数据.由于数据的保密性,这些数据无法进行共享,从而限制了模型的训练,故采用了联邦边云计算方法,允许多个运营商在保持数据隐私的前提下共同训练BERT模型.联邦学习结合边云计算方法,在本地对轨道交通各运营商的数据进行初步处理,然后将汇总后的梯度上传至云端进行模型训练,最终将训练得到的模型参数发送回各边缘设备,实现模型的更新.研究结果表明,采用联邦边云计算方法进行BERT模型训练,在轨道交通领域的故障检测任务中优于目前已有的先进方案.这一方法在解决数据保密性问题的同时,有效提升了轨道交通故障检测的准确性与可靠性.

    轨道交通故障检测边云计算联邦学习BERT