首页期刊导航|控制与决策
期刊信息/Journal information
控制与决策
控制与决策

张嗣瀛 王福利

月刊

1001-0920

kzyjc@mail.neu.edu.cn

024-83687766

110819

沈阳东北大学125信箱

控制与决策/Journal Control and DecisionCSCD北大核心CSTPCDEI
查看更多>>本刊创刊于1986年,由教育部主管,东北大学主办.本刊是自动控制与决策领域的综合性学术期刊,大16开,月刊,经邮局发行.本刊是研究生教育中文重要期刊,中文核心期刊,并已进入美国Ei等几大检索系统.本刊的影响因子历年在信息与系统类期刊中名列前茅.连续两年被评为百种中国杰出学术期刊.
正式出版
收录年代

    基于逆高斯过程的二元退化可靠性建模与评估

    安绮梦闫在在孙立君
    3727-3735页
    查看更多>>摘要:为了实现单个产品的可靠度估计和剩余使用寿命预测,在综合利用产品总体和个体退化信息的基础上,提出一种考虑个体差异性的二元逆高斯退化模型。首先,基于Copula函数建立二元逆高斯过程退化模型,并从性能退化速率与性能间相关关系两方面对个体差异性进行描述;然后,利用两阶段期望最大化算法,先后对单性能模型和Copula函数中参数值进行估计;接着,基于个体退化特性和Bayes理论,分别提出个体缺失观测值估计和退化值预测的模拟方法,并利用退化量预测值对个体的剩余使用寿命进行预测;最后,通过重型机床的实例数据验证所提出模型和统计推断方法的有效性,并对产品后续预防性维修和健康管理提出建议。

    逆高斯过程两阶段期望最大化算法Copula函数缺失观测值剩余使用寿命预测

    基于贝叶斯推断的高超声速滑翔目标轨迹预测方法

    韩宇辰王松艳权申明晁涛...
    3736-3744页
    查看更多>>摘要:针对高超声速滑翔飞行器因其强机动性、高灵活性,轨迹难以预测的问题,提出一种基于贝叶斯推断的高超声速滑翔飞行器轨迹预测方法。首先,根据高超声速滑翔飞行器攻击某目标的意图信息和战场态势信息,设计意图代价函数量化其攻击意图;然后,采用贝叶斯推断迭代递推目标的机动模式和运动状态;最后,利用蒙特卡洛序贯滤波方法计算目标状态分布进而预测其轨迹。仿真实验结果表明:所提出方法能够有效预测高超声速滑翔飞行器的轨迹,当有多个目标时能够给出各目标被攻击的概率,为防御方提供决策参考。

    高超声速飞行器轨迹预测贝叶斯理论马尔科夫过程蒙特卡洛序贯滤波禁飞区

    事件触发机制的多弹分布式微分对策制导律

    席阿行蔡远利
    3745-3754页
    查看更多>>摘要:为了减少多弹协同控制系统的计算负担与通信资源,引入事件触发机制,研究分布式微分对策制导律。首先,将分布式微分对策制导问题转化为分布式零和博弈问题,利用自适应动态规划求解其事件触发的耦合Hamilton-Jacobi-Bellman方程,同时设计事件触发机制的触发条件和自适应评价网络权重的更新律,提出一种事件触发机制的分布式微分对策制导律;然后,依据Lyapunov定理证明多弹协同系统的稳定性和评价网络估计权重误差的最终一致有界;进而,设计最小采样时间间隔以确保系统不出现Zeno行为;最后,通过仿真实例验证所提出制导律的有效性。结果表明,与传统的分布式微分对策制导律相比,所提出的制导律对控制器状态更新次数可减少65。36%,极大地减少了控制系统的计算负担与通信资源。

    多弹协同制导事件触发机制分布式控制零和博弈自适应动态规划Hamilton-Jacobi-Bellman方程

    事件触发式多智能体分层安全强化学习运动规划

    孙辉辉胡春鹤张军国
    3755-3762页
    查看更多>>摘要:针对深度强化学习序贯决策过程中面临的动作安全性问题,研究一种事件触发式多智能体分层安全强化学习运动规划方法。首先,基于受限马尔可夫决策模型,构建一种具备安全约束的多智能体深度确定性策略梯度框架,该框架针对不同状态空间,以事件触发的方式实现运动策略的分层学习;然后,通过引入李雅普诺夫评价网络,建立带有条件约束的目标动作选择机制,并利用拉格朗日乘子法,解决多目标约束求解困难的问题,保证机器人内部决策的安全性;最后,在多机器人强化学习场景中对所提出方法进行实验。实验结果表明:触发式多智能体分层安全强化学习方法使得机器人的状态轨迹从危险状态中快速恢复至安全空间,增强了策略的安全性和多机协同运动规划能力。

    强化学习安全约束运动规划多智能体事件触发

    AGTB-RRT*:一种基于近似测地线避障策略的目标双向3D RRT*路径规划算法

    刘乐李斌方一鸣赵栋梁...
    3763-3771页
    查看更多>>摘要:针对传统3D RRT*全局路径规划算法存在的采样基数大、父节点重选计算量大、节点扩展盲目、搜索路径不平滑等问题,提出一种基于近似测地线避障策略的目标双向3DRRT*路径规划算法(approximate geodesic target bidirectional RRT*,AGTB-RRT*)。首先,在双向目标点的连接路径上设置近似中位节点,并建立朝起点和目标点双向扩展的随机树,有效提高算法的搜索效率;建立基于单叶双曲面的启发式采样空间,有效减小采样基数和父节点重选计算量并降低内存占用。其次,对目标点和随机点进行阈值切换,并建立目标引力势场,有效降低节点扩展盲目性,提高算法的收敛速度。再次,对3D障碍物建立三角网格包络,并基于近似测地线方法使节点沿3D障碍物包络表面快速绕行,进而规划出一条代价小、速度快的局部避障路径。最后,采用B样条曲线拟合方法对整个生成路径进行优化处理,以得到一条平滑的最优可行路径。仿真实验结果验证了所提出AGTB-RRT*算法在三维空间下用于路径规划的有效性和可行性。

    RRT*路径规划启发式采样目标引力势场局部避障近似测地线

    自适应分组和拥挤距离更新的多目标狼群算法

    赵嘉吕丰肖人彬樊棠怀...
    3772-3780页
    查看更多>>摘要:鉴于狼群算法在单目标优化问题中具有良好的求解能力,借助狼群的生物习性并用于求解多目标优化问题,提出自适应分组和拥挤距离更新的多目标狼群算法(MOWPA-AG)。首先,模拟狼群中的家族聚集性,提出兼顾种群多样性和分散搜索的自适应分组策略,对种群进行分层并帮助种群扩散检索Pareto最优解;然后,设计基于拥挤距离的群体更新机制,使种群保持快速进化的同时获得最优解集;为验证算法的性能,在9种不同的基准测试问题上进行测试,并与经典及新进多目标优化算法进行比较以验证MOWPA-AG的有效性;最后,将MOWPA-AG用于解决实际工程四杆桁架结构问题,以体现所提出算法的普适性。

    群智能算法多目标优化狼群算法Pareto最优自适应分组工程优化

    基于随机森林和自适应随机排序的昂贵多目标进化算法

    田家鑫李岩张伟刘圆超...
    3781-3790页
    查看更多>>摘要:针对昂贵约束多目标离散优化问题,提出一种基于随机森林和自适应随机排序的昂贵多目标进化算法(a random forest and adaptive stochastic ranking based multi-objective evolutionary algorithm,RFASRMOEA)。为了提高代理模型对离散问题的近似精度,RFASRMOEA采用随机森林作为代理模型辅助进化算法进行搜索。同时,为提升综合性能,提出一种基于平衡适应度评估策略和自适应概率操作的自适应随机排序机制。具体地,平衡适应度评估策略利用种群迭代信息结合所设计的基于目标转移的多样性评估和基于余弦的收敛性评估,充分发掘种群个体潜力。而自适应概率操作通过动态调整随机排序机制的关注点,使得算法在前期探索更多可行域而后期迅速收敛于可行域,进而平衡约束条件的满足与目标函数优化之间的冲突。在测试问题上的实验结果表明,所提出算法在处理昂贵约束多目标离散优化问题时具有较高的竞争力。

    昂贵约束多目标离散优化问题代理模型随机森林进化算法自适应随机排序机制

    多产品两阶段批处理流水线调度策略及性能分析

    闫飞一王军强
    3791-3800页
    查看更多>>摘要:以多产品两阶段批处理流水线为研究对象,探究不同调度策略对流水线性能的影响,量化分析产线生产率、在制品水平等性能。首先,针对上游机器效率最高优先加工策略、下游机器效率最高优先加工策略、最长队列优先加工策略、循环加工策略等4种不同调度策略,分别刻画系统状态空间,基于马尔可夫过程建立性能评估模型,量化生产率等性能指标。然后,考虑缓冲区容量与批容量关系,对比4种调度策略对系统性能指标的影响。结果表明:在缓冲区容量与批容量无关的情形下,循环加工策略表现优于其他3种调度策略;在缓冲区容量与批容量正相关的情形下,最长队列优先加工策略表现优于其他3种调度策略。

    性能分析调度策略多产品批处理流水线

    多微网系统端网协同分布式实时智能优化

    王丹璐孙秋野苏涵光
    3801-3809页
    查看更多>>摘要:多微网互联对于提升微网稳定性和促进可再生能源消纳具有重要作用,对此,考虑多微网系统网内多智能终端协同和网间功率互济需求,提出一种基于多智能体强化学习的端-网实时协同优化算法。该算法可自适应源荷不确定性和系统拓扑变化,实时产生网间能量互济和网内智能终端协同优化策略。首先建立端-网协同优化系统结构和优化模型;其次建立基于多智能体马尔科夫决策过程的强化学习模型,进而提出基于多智能体近端策略优化算法(MAPPO)的分布式协同优化算法;然后考虑调节过程中功率平衡约束,设计一种新的功率平衡反馈信号,能够有效避免功率不平衡现象的出现;最后针对3个典型场景进行仿真,结果表明各微电网无需全局信息便可得到准确的近似全局最优解。将所提出方法分别与状态完全观测和状态部分观测的分布式强化学习算法进行对比,结果表明所提出的方法既能获得良好的协同优化效果,又能满足实时优化对于算法效率的需求。

    端网协同多智能体近端策略优化能量互济多微网实时优化

    考虑客户取货行为和车辆移动停靠自提的最后一公里配送研究

    周林洪凌睿何华英杜建辉...
    3810-3818页
    查看更多>>摘要:为提高最后一公里配送效率并降低配送成本,基于送货上门和自提两种配送需求,提出送货上门与车辆停靠移动自提相结合的混合交付模式并开展配送优化研究。首先,通过客户取货行为研究建立车辆停靠调度与客户取货行为关联;在此基础上,开展车辆停靠选址-停靠时长调度-车辆路径集成决策,构建以车辆使用成本、路径成本和自提失败追索成本之和最小的混合整数规划模型;然后,针对该问题特征设计改进的变邻域搜索算法高效求解,并通过仿真实验对算法的有效性进行验证;最后,开展模型及关键参数的敏感性分析。实验结果表明,移动停靠自提、调度时长粒度、停靠点数量及收费模式等对配送系统影响显著,综合考虑这些因素对最后一公里配送系统构建具有较强的现实意义。

    客户取货行为车辆移动停靠自提改进变邻域搜索算法最后一公里配送