首页期刊导航|控制理论与应用
期刊信息/Journal information
控制理论与应用
华南理工大学 中国科学院数学与系统科学研究院
控制理论与应用

华南理工大学 中国科学院数学与系统科学研究院

胡跃明

月刊

1000-8152

aukzllyy@scut.edu.cn

020-87111464

510640

广州市五山华南理工大学内

控制理论与应用/Journal Control Theory & ApplicationsCSCD北大核心CSTPCDEI
查看更多>>本刊是经教育部批准,由华南理工大学和中国科学院系统科学研究所联合主办的全国性一级学术刊物。1984年创刊,1999年开始改为A4开本。国内外公开发行。《控制理论与应用》主要报道系统控制科学中具有新观念、新思想的理论研究成果及其在各个领域中,特别是高科技领域中的应用研究成果,内容包括:1.集中参数控制系统;2.线性与非线性控制系统;3.分布参数控制系统;4.随机控制系统;5.离散事件系统;6.大系统理论;7.混合系统;8.系统辨识与建模;9.自适应控制;10.鲁棒控制;11.智能控制;12.优化与控制算法;13.先进控制理论在实际系统中的应用;14.系统控制科学中的其它重要问题。
正式出版
收录年代

    深度强化学习算法求解动态流水车间实时调度问题

    杨媛媛胡蓉钱斌张长胜...
    1047-1055页
    查看更多>>摘要:本文针对动态流水车间调度问题(DFSP),以最小化最大完工时间为优化目标,提出一种自适应深度强化学习算法(ADRLA)进行求解。首先,将DFSP的新工件动态到达过程模拟为泊松过程,进而采用马尔科夫决策过程(MDP)对DFSP的求解过程进行描述,将DFSP转化为可由强化学习求解的序贯决策问题。然后,根据DFSP的排序模型特点,设计具有较好状态特征区分度和泛化性的状态特征向量,并依此提出5种特定动作(即调度规则)来选择当前需加工的工件,同时构造基于问题特性的奖励函数以获取动作执行效果的评价值(即奖励值),从而确定ADRLA的3类基本要素。进而,以深度双Q网络(DDQN)作为ADRLA中的智能体,用于进行调度决策。该智能体采用由少量小规模DFSP确定的数据集(即3类基本要素在不同问题上的数据)训练后,可较准确刻画不同规模DFSP的状态特征向量与Q值向量(由各动作的Q值组成)间的非线性关系,从而能对各种规模DFSP进行自适应实时调度。最后,通过在不同测试问题上的仿真实验和与算法比较,验证了所提ADRLA求解DFSP的有效性和实时性。

    流水车间调度新工件到达深度强化学习动态实时调度智能调度

    异构群智感知PPO多目标任务指派方法

    杨潇郭一楠吉建娇刘旭...
    1056-1066页
    查看更多>>摘要:现有移动群智感知系统的任务指派主要面向单一类型移动用户展开,对于存在多种类型移动用户的异构群智感知任务指派研究相对缺乏。为此,本文针对异质移动用户,定义其区域可达性,并给出感知子区域类型划分。进而,兼顾感知任务数量和移动用户规模的时变性,构建了动态异构群智感知系统任务指派的多目标约束优化模型。模型以最大化感知质量和最小化感知成本为目标,综合考虑用户的最大任务执行数量、无人机的受限工作时间等约束。为解决该优化问题,本文提出一种基于近端策略优化的多目标进化优化算法。采用近端策略优化,根据种群的当前进化状态,选取具有最高奖励值的进化算子,生成子代种群。面向不同异构群智感知实例,与多种算法的对比实验结果表明,所提算法获得的Pareto最优解集具有最佳的收敛性和分布性,进化算子选择策略可以有效提升对时变因素的适应能力,改善算法性能。

    异构群智感知多目标优化强化学习近端策略优化

    双重信息引导的蚁群算法求解绿色多舱车辆路径问题

    郭宁申秋义钱斌那靖...
    1067-1078页
    查看更多>>摘要:针对当前实际运输中广泛存在的绿色多舱车辆路径问题(GMCVRP),文章提出一种双重信息引导的蚁群优化算法(DIACO)进行求解。首先,在DIACO的全局搜索阶段,重新构建传统蚁群优化算法(TACO)中的信息素浓度矩阵(PCM),使其同时包含客户块信息和客户序列信息,即建立具有双重信息的PCM(DIPCM),从而更全面学习和累积优质解的信息;采用3种启发式方法生成较高质量个体,用于初始化DIPCM,可快速引导算法朝向解空间中优质区域进行搜索。其次,在DIACO的局部搜索阶段,设计结合自适应策略的多种变邻域操作,用于对解空间的优质区域执行深入搜索。再次,提出信息素浓度平衡机制,以防止搜索陷入停滞。最后,使用不同规模的算例进行仿真测试和算法对比,结果验证了DIACO是求解GMCVRP的有效算法。

    多舱车辆路径问题绿色蚁群优化算法双重信息引导信息素浓度平衡机制

    工位数固定的U型拆卸线部分拆卸平衡问题

    吴秀丽张兴宇
    1079-1088页
    查看更多>>摘要:为提高工位数固定的U型拆卸线拆卸效率,减少有害部件对操作人员的潜在威胁,针对高价值零部件和有害零部件的拆卸需求,本文提出了工位数固定的U型拆卸线部分拆卸平衡问题,建立了以最小化节拍时间、高危工位数目和负载均衡为目标的优化模型,并设计了改进的变邻域搜索算法进行求解。在编码过程中提出一种基于零部件释放位置的选择策略,以减少前继零部件拆卸顺序对编码的影响;提出最小偏差二分法,有效减少解码的迭代次数;提出瓶颈挤压局部搜索策略,用以优化节拍时间和均衡负载指标。通过与其他算法对比,结果表明改进的变邻域搜索算法求解具有优越性,并且可实现对工位数固定的U型拆卸线部分拆卸平衡问题的高效求解。

    拆卸线平衡U型拆卸线变邻域搜索算法工位数固定瓶颈挤压局部搜索策略

    邻域自适应粒子群算法求解地源热泵区域能源系统鲁棒优化调度问题

    吴亮红王维张红强贾睿...
    1089-1100页
    查看更多>>摘要:针对地源热泵区域能源系统中冷热负荷和机组效能的不确定性,本文提出了一种考虑双重不确定性的鲁棒优化调度方法。首先,基于多面体不确定模型描述调度模型中的鲁棒变量。然后,针对建筑冷热负荷不确定性,采用对偶原理将双层优化模型等价为单层优化模型;对于机组效能不确定性,采用场景法进行分析。最后,采用多目标优化约束处理方法处理鲁棒优化调度模型中的约束条件。同时,为更加高效、准确求解所构建的优化调度模型,提出了一种邻域自适应粒子群优化算法(NAPSO)。实验结果表明,在制冷和制热工况下,与经验运行策略相比,本文所提方法可分别减少7。22%和5。55%的系统运行成本,是一种解决地源热泵区域能源系统鲁棒优化调度的有效方法。

    地源热泵鲁棒优化调度邻域自适应粒子群优化不确定性

    通勤合乘路径优化模型与算法

    李旺柳伍生肖义萍李薇...
    1101-1110页
    查看更多>>摘要:道路车辆的增多导致城市交通和环境问题日益严重,共享合乘被认为是减少交通拥堵,降低碳排放的有效方法,特别是在新冠疫情持续影响下,通勤者采用互助合乘出行意愿较高。本文考虑到通勤时间的紧迫性,通勤者存在通勤压力和合乘不适感,在没有经济效益驱动的情况下,限制合乘路径的匹配范围,并加入惩罚因子以提高合乘配对成功率。本文提出了一种基于最优时间插值的贪婪启发式算法,添加了3种扰动算子来提高全局搜索能力,采用多组不同规模案例测试扰动效果。结果表明:设计算法可以在短时间内求解出更优结果,在解决大规模问题上,相比于精确算法、粒子群算法和遗传算法更具竞争力。此外,通过选取位置较远且分布均匀的职员作为接送者,可以改善合乘效果。

    交通工程共享合乘路径优化启发式算法通勤出行

    策略梯度的超启发算法求解带容量约束车辆路径问题

    张景玲孙钰粟赵燕伟余孟凡...
    1111-1122页
    查看更多>>摘要:有容量车辆路径问题是组合优化问题中比较热门的问题,它属于经典的NP-hard问题并且时间复杂度高。本文提出了一种基于策略梯度的超启发算法,将强化学习中的确定性策略梯度算法引入到超启发算法的高层策略中的底层算法选择策略,确定性策略梯度算法采用Actor-Critic框架,另外为了能够在后续计算和神经网络参数更新中引用历史经验数据,在确定性策略梯度算法中设计了经验池用于存储状态转移数据。在超启发算法解的接受准则方面,文中通过实验对比了3种接受准则的效果,最终选择了自适应接受准则作为高层策略中解的接受准则。通过对有容量车辆路径问题标准算例的计算,并将求解结果与其他算法对比,验证了所提算法在该问题求解上的有效性和稳定性。

    车辆路径问题强化学习关策略梯度算法神经网络超启发算法

    基于残差图卷积网络与深度强化学习的需求可拆分车辆路径优化算法

    罗佳李朝锋
    1123-1136页
    查看更多>>摘要:需求可拆分车辆路径问题(SDVRP)出现在广泛的物流配送场景中,具有重要的研究价值。高效的SDVRP优化算法能够提高车辆装载率,降低物流配送成本。为提高SDVRP的求解效率,本文提出基于残差图卷积神经网络(RGCN)和多头注意力的深度强化学习算法(REINFORCE),逐步构建可行解序列。首先,从强化学习的角度出发,文章对SDVRP建立马尔科夫决策模型,定义序列预测过程的环境状态、智能体动作空间、状态转移函数等。其次,建立编-解码模型求解节点选择策略,其中使用残差图卷积神经网络的编码器重构配送中心和客户节点的特征,将配送网络中节点间的连接关系与节点特征相互关联,获得差异性显著的特征嵌入向量;利用注意力网络解码器在重构后的嵌入向量基础上融合动态变化的车辆剩余装载量和客户需求等信息执行解码任务,实现每次迭代为单个案例提供多个可行解。最后,提出基于平均基准值的REINFORCE算法更新模型参数,通过求解不同问题规模测试集、标准SDVRP数据集,以及京东物流实际配送任务,验证了所提算法的有效性。

    需求可拆分车辆路径问题残差图卷积神经网络注意力机制深度强化学习

    求解分布式两阶段混合流水车间调度的反馈人工蜂群算法

    王移民雷德明
    1137-1146页
    查看更多>>摘要:针对考虑工厂适用性和附加资源的分布式两阶段混合流水车间调度问题(DTHFSP),本文提出了一种反馈人工蜂群算法(FABC),以最小化最大完成时间和总延迟时间,该算法利用一种新型反馈机制动态调整搜索策略集。为此,本文共设计了5种特点各异的搜索策略,将其用于初始策略集和备选策略集,同时,建立并调整雇佣蜂群和跟随蜂群的共享策略集,雇佣蜂阶段和跟随蜂阶段在种群划分的基础上采用随机选择和自适应选择方式确定搜索策略,在侦查蜂阶段完成后,对搜索策略集进行动态调整。文章进行了大量的计算实验,计算结果表明,FABC策略合理有效,且它对所求解的DTHFSP具有较强的搜索优势。

    工厂适用性附加资源分布式两阶段混合流水车间调度反馈人工蜂群算法

    求解能耗成本平衡的分布式阻塞流水线调度群体迭代贪婪算法

    韩雪王玉亭韩玉艳李俊青...
    1147-1155页
    查看更多>>摘要:在经典分布式流水车间调度问题基础上,本文构建了具有序列相关准备时间的分布式阻塞流水线调度问题(DBFSP-SDST)的混合线性整数规划模型(MILP),以均衡各工厂能耗成本为优化目标,提出了基于群体优化的迭代贪婪算法(PEIG)。该算法针对零缓冲区和多工厂生产模式,设计了问题特性的启发式方法;针对迭代贪婪算法(IGA)的优势和不足,提出了基于群体的局部搜索策略、多邻域搜索结构和增强的跨工厂破坏重构方法,以进一步平衡所提算法的全局探索和局部搜索能力。通过270个测试算例的数值仿真,以及与最新4种代表算法的统计比较,本文验证了所提PEIG算法的优越性,能为中大规模的DBFSP_SDST提供更优的调度方案。

    分布式阻塞流水调度能耗成本群体局部搜索策略迭代贪婪算法