首页期刊导航|控制理论与应用
期刊信息/Journal information
控制理论与应用
华南理工大学 中国科学院数学与系统科学研究院
控制理论与应用

华南理工大学 中国科学院数学与系统科学研究院

胡跃明

月刊

1000-8152

aukzllyy@scut.edu.cn

020-87111464

510640

广州市五山华南理工大学内

控制理论与应用/Journal Control Theory & ApplicationsCSCD北大核心CSTPCDEI
查看更多>>本刊是经教育部批准,由华南理工大学和中国科学院系统科学研究所联合主办的全国性一级学术刊物。1984年创刊,1999年开始改为A4开本。国内外公开发行。《控制理论与应用》主要报道系统控制科学中具有新观念、新思想的理论研究成果及其在各个领域中,特别是高科技领域中的应用研究成果,内容包括:1.集中参数控制系统;2.线性与非线性控制系统;3.分布参数控制系统;4.随机控制系统;5.离散事件系统;6.大系统理论;7.混合系统;8.系统辨识与建模;9.自适应控制;10.鲁棒控制;11.智能控制;12.优化与控制算法;13.先进控制理论在实际系统中的应用;14.系统控制科学中的其它重要问题。
正式出版
收录年代

    求解大规模全局优化问题的新型三层递归差分分组方法

    李飞刘翔徐洪斌刘建昌...
    691-700页
    查看更多>>摘要:协同进化算法在求解大规模全局优化问题上具有较好的效果,其核心思想是利用分而治之的策略将一个高维问题分解成若干个子问题,然后分别优化每个子问题。然而,现有的分解方法通常需要花费大量的计算成本来获得精确的变量分组。通过采用递归交互检测中的历史信息简化分组过程,能够避免检测某些集合的相互关系,本文提出了一种新型三层递归差分分组策略(NTRDG)。与其他4种现有的分组方法相比,NTRDG在不影响分组精度的情况下计算成本消耗较低。仿真结果表明,NTRDG在求解大规模全局优化问题时具有很强的竞争力。

    全局优化协同进化分解方法三层递归差分分组递归搜索

    存在未知时滞非线性系统的迭代变区间预测迭代学习控制

    余琼霞田丰臣孙俊杰侯忠生...
    701-715页
    查看更多>>摘要:本文针对机理模型未知的非线性非仿射多入多出(MIMO)离散时间系统,研究了系统同时存在未知时滞和迭代变化运行时间区间的预测迭代学习控制(PILC)问题。首先利用未知时滞的上下界信息建立了一种新型的动态线性化(DL)模型,理论分析表明该模型能够等价描述本文所考虑的存在未知时滞的未知非线性系统。同时,设计一种新的数据补偿机制用以处理由于系统运行时间区间迭代变化而引起的数据丢失问题。基于所建立的DL模型和数据补偿机制,设计了能够同时处理未知时滞和迭代变化运行时间区间的预测迭代学习控制方法。通过严格的理论分析同时给出了建模误差和跟踪控制误差的收敛性质。最后,通过仿真进一步验证了所提方法的有效性。

    迭代学习控制预测迭代学习控制未知时滞迭代变区间

    结合优势结构和最小目标Q值的深度强化学习导航算法

    朱威洪力栋施海东何德峰...
    716-728页
    查看更多>>摘要:针对现有基于策略梯度的深度强化学习方法应用于办公室、走廊等室内复杂场景下的机器人导航时,存在训练时间长、学习效率低的问题,本文提出了一种结合优势结构和最小化目标Q值的深度强化学习导航算法。该算法将优势结构引入到基于策略梯度的深度强化学习算法中,以区分同一状态价值下的动作差异,提升学习效率,并且在多目标导航场景中,对状态价值进行单独估计,利用地图信息提供更准确的价值判断。同时,针对离散控制中缓解目标Q值过估计方法在强化学习主流的Actor-Critic框架下难以奏效,设计了基于高斯平滑的最小目标Q值方法,以减小过估计对训练的影响。实验结果表明本文算法能够有效加快学习速率,在单目标、多目标连续导航训练过程中,收敛速度上都优于柔性演员评论家算法(SAC),双延迟深度策略性梯度算法(TD3),深度确定性策略梯度算法(DDPG),并使移动机器人有效远离障碍物,训练得到的导航模型具备较好的泛化能力。

    强化学习移动机器人导航优势结构最小化目标Q值

    基于自适应分布式滤波观测器的多智能体系统编队控制

    高焕丽李玮孟伟蔡鹤...
    729-737页
    查看更多>>摘要:本文考虑了全局指令系统输出信息受到信道扰动情况下线性多智能体系统的编队控制问题。首先,基于协作式输出调节理论框架对线性多智能体系统的编队控制问题进行数学建模。其次,针对受到信道扰动的全局指令系统输出信息,提出了一类基于受扰输出的自适应分布式滤波观测器,在降低网络信息交换量的同时消除扰动的影响。最后,设计了输出反馈确定等价控制律,解决了线性多智能体系统的分布式编队控制问题。给出了数值仿真结果检验控制性能。

    多智能体系统编队控制协作式输出调节分布式滤波观测器

    变负载机械手轨迹跟踪控制器设计

    赵兴强刘振朱全民
    738-744页
    查看更多>>摘要:本文针对具有变负载的不确定刚性机械手系统,提出了一种依赖平均驻留时间的神经网络自适应切换控制策略。本控制方案将夹持不同负载的刚性机械手系统视为切换系统,即根据负载的不同将整个系统分为若干子系统,并基于平均驻留时间原则对每个子系统分别设计控制器。在各子系统中,分别采用径向基函数(RBF)神经网络逼近系统结构参数,以避免控制器对系统精确模型的依赖。同时,基于神经网络设计鲁棒补偿项,以抑制集总扰动对系统的影响。然后,利用多Lyapunov函数方法证明了轨迹跟踪误差的一致最终有界性。最后,通过仿真验证,所提出的控制方案不仅可实现变负载机械手期望轨迹的高精度跟踪,而且可有效削弱输入力矩的抖振。

    切换控制器机械手神经网络平均驻留时间自适应控制

    窗口长度自适应调整的策略迭代最优控制

    方欣栾小丽刘飞
    745-750页
    查看更多>>摘要:在系统模型参数未知的最优控制问题中,策略迭代能否快速收敛到最优控制策略的关键在于值函数的估计。为了提升值函数的估计精度以及收敛速度,本文提出一种窗口长度自适应调整的策略迭代最优控制算法。充分利用一段时间内的历史样本数据,通过影响力函数构建窗口长度与值函数估计性能之间的定量关系,根据数据窗口长度对估计性能影响力的不同,实现窗口长度的自适应调整。最后,将本文所提方法应用到连续发酵过程,结果表明,本文所提方法能够加快最优控制策略的收敛,克服参数变化或外部扰动对控制性能的影响,从而提升控制精度。

    最优控制策略迭代窗口长度自适应调整影响力函数

    多舱共配绿色车辆路径问题的改进变邻域搜索算法

    肖友刚曹健陈婉茹张得志...
    751-762页
    查看更多>>摘要:针对社区团购前置仓配送场景中"多中心、高时效、多品类、高排放"难题,本文提出多车场带时间窗的绿色多舱车车辆路径问题(MDMCG-VRPTW),构建混合整数线性规划模型,并设计改进的变邻域搜索算法(IVNS)实现求解。采用两阶段混合算法构造高质量初始解。提出均衡抖动策略以充分探索解空间,引入粒度机制以提升局部搜索阶段的寻优效率。标准算例测试结果验证了两阶段初始解构造算法和IVNS算法的有效性。仿真实验结果表明,模型与算法能够有效求解MDMCGVRPTW,且改进策略提高了算法的求解效率和全局搜索能力。最后,基于对配送策略和时效性的敏感性分析,为相关配送企业降本增效提供更多决策依据。

    多舱共配绿色车辆路径均衡抖动粒度局部搜索改进变邻域搜索算法

    电液伺服系统多PID控制器参数整定优化

    冯浩姜金叶宋倩玉马伟...
    763-767页
    查看更多>>摘要:为了解决挖掘机器人动臂、斗杆和铲斗不同电液伺服系统中多个比例-积分-微分(PID)控制器参数优化的难题,提高挖掘机器人铲斗齿尖轨迹跟踪精度,采用改进的粒子群算法(PSO)对多PID控制器参数进行整定优化。首先,建立电液伺服系统的数学机理模型,在理论模型的基础上,采用递推最小二乘辨识法(RLS)得到实际的机理模型。其次,提出一种改进的PSO算法,采用非线性自适应惯性权重、引入异步变化策略、设计精英变异方法。接着,搭建仿真验证平台,跟踪正弦轨迹,比较传统Z-N参数整定方法、基本PSO算法和改进PSO算法的差别。最后,以挖掘机器人最常见的整平为代表工况,基于23 t挖掘机器人实验平台进行实验验证。实验结果表明,改进PSO算法的跟踪精度最高,与基本PSO算法相比,明显提高了轨迹跟踪精度。

    电液伺服系统机器人轨迹控制粒子群算法智能控制

    《控制理论与应用》征稿简则

    768页