首页期刊导航|控制与决策
期刊信息/Journal information
控制与决策
控制与决策

张嗣瀛 王福利

月刊

1001-0920

kzyjc@mail.neu.edu.cn

024-83687766

110819

沈阳东北大学125信箱

控制与决策/Journal Control and DecisionCSCD北大核心CSTPCDEI
查看更多>>本刊创刊于1986年,由教育部主管,东北大学主办.本刊是自动控制与决策领域的综合性学术期刊,大16开,月刊,经邮局发行.本刊是研究生教育中文重要期刊,中文核心期刊,并已进入美国Ei等几大检索系统.本刊的影响因子历年在信息与系统类期刊中名列前茅.连续两年被评为百种中国杰出学术期刊.
正式出版
收录年代

    机器人增量学习研究综述

    马旭淼徐德
    1409-1423页
    查看更多>>摘要:机器人的应用场景正在不断更新换代,数据量也在日益增长。传统的机器学习方法难以适应动态的环境,而增量学习技术能够模拟人类的学习过程,使机器人能利用旧知识来加快新任务的学习,在不遗忘旧技能的前提下学习新的技能。目前对于机器人增量学习的相关研究仍然较少,对此,主要介绍机器人增量学习研究进展。首先,对增量学习进行简介;其次,从参数和模型的角度出发,将当前机器人增量学习主流方法分为变参数方法、变模型方法、混合方法3类,分别对每一类进行论述,并给出相应的增量学习技术在机器人领域中的应用实例;然后,对机器人增量学习中常用的数据集和评价指标进行介绍;最后,对增量学习未来的发展趋势进行展望。

    增量学习变参数方法变模型方法混合方法技能学习机器人

    T-CPS下考虑人驾车行为影响的混行车辆协同控制

    黄帅孙棣华赵敏
    1424-1432页
    查看更多>>摘要:由于传统人驾车(traditional human-driven vehicles,HVs)驾驶行为会受到驾驶员的心理和生理活动的不确定性影响,可能使得车辆频繁地加减速,进而导致混合交通条件下网联自动车(connected and automated vehicles,CAVs)很难快速跟踪此行为。针对这一问题,首先提出一种提前预测传统人驾车行为的组合神经网络。在此基础上,考虑通信时延和车辆运动学特性,设计一种基于交通信息物理系统(transportation-cyber physical system,T-CPS)的混行车群内车辆协同控制策略,使其能够快速跟踪上传统人驾车行为,并对混行车群内网联自动车之间的串稳定性进行分析。最后,在混合交通条件下设置由1辆传统人驾车、1辆领头网联自动车和4辆跟随网联自动车形成的混行车群,利用下一代交通仿真(next generation simulation,NGSIM)车辆轨迹数据选出高质量传统人驾车状态,并通过仿真实验验证所提协同控制策略的有效性和可行性。由仿真实验结果可知,所提协同控制策略可以保证所有的网联自动车能够快速跟踪上传统人驾车行为,为解决新型混合交通带来的新问题提供一定的理论指导和借鉴。

    混合交通交通信息物理系统人驾车行为协同控制组合神经网络NGSIM

    基于强化学习的挖掘机时间最优轨迹规划

    张韵悦孙志毅孙前来王银...
    1433-1440页
    查看更多>>摘要:针对挖掘机的自主作业场景,提出基于强化学习的时间最优轨迹规划方法。首先,搭建仿真环境用于产生数据,以动臂、斗杆和铲斗关节的角度、角速度为状态观测变量,以各关节的角加速度值为动作信息,通过状态观测信息实现仿真环境与自主学习算法的交互;然后,设计以动臂、斗杆和铲斗关节运动是否超出允许范围、完成任务总时间和目标相对距离为奖励函数对策略网络参数进行训练;最后,利用改进的近端策略优化算法(proximal policy optimization,PPO)实现挖掘机的时间最优轨迹规划。与此同时,与不同连续动作空间的强化学习算法进行对比,实验结果表明:所提出优化算法效率更高,收敛速度更快,作业轨迹更平滑,可有效避免各关节受到较大冲击,有助于挖掘机高效、平稳地作业。

    挖掘机自主作业轨迹规划多智能体PPO算法智能决策

    基于多尺度混合注意力与度量融合的小样本行人重识别

    陈贵震邹国锋刘月傅桂霞...
    1441-1449页
    查看更多>>摘要:针对行人重识别中可用行人图像不足导致的小样本问题,以双相似网络为基础,提出一种基于多尺度混合注意力与度量融合的小样本行人重识别方法。首先,将多尺度混合注意力机制引入特征嵌入模块,即在不同尺度层内的特征提取中引入空间注意力,在不同尺度层间的特征融合中引入通道注意力,实现更具判别力的小样本行人特征提取;然后,在度量模块,提出欧氏距离与余弦距离融合的双重度量方法,实现行人特征的空间绝对距离和方向差异的综合度量,提升行人相似性度量的可靠性;接着,采用双重度量方式和关系度量方式,分别获得行人特征的相似度得分;最后,通过加权融合获得联合度量得分,构建联合损失实现网络的整体优化和训练。在Market-mini、Duke-mini和MSMT17-mini三个小型数据集上的实验表明,所提出方法在5-way 1-shot和5-way 5-shot两种模式下的平均识别准确率分别达到90。40%和95。69%、86。77%和94。96%、71。08%和82。63%,与其他小样本学习算法相比,识别性能有较大提升。

    行人重识别小样本双相似网络多尺度混合注意力度量融合双重度量

    高精度实时语义分割算法框架:多通道深度加权聚合网络

    齐咏生陈培亮高学金董朝轶...
    1450-1460页
    查看更多>>摘要:近年来随着深度学习技术的不断发展,涌现出各种基于深度学习的语义分割算法,然而绝大部分分割算法都无法实现推理速度和语义分割精度的兼得。针对此问题,提出一种多通道深度加权聚合网络(MCDWA_Net)的实时语义分割框架。该方法首先引入多通道思想,构建一种3通道语义表征模型,3通道结构分别用于提取图像的3类互补语义信息:低级语义通道输出图像中物体的边缘、颜色、结构等局部特征;辅助语义通道提取介于低级语义和高级语义的过渡信息,并实现对高级语义通道的多层反馈;高级语义通道获取图像中上下文逻辑关系及类别语义信息。之后,设计一种3类语义特征加权聚合模块,用于输出更完整的全局语义描述。最后,引入一种增强训练机制,实现训练阶段的特征增强,进而改善训练速度。实验结果表明,所提出方法在复杂场景中进行语义分割不仅有较快的推理速度,且有很高的分割精度,能够实现语义分割速度与精度的均衡。

    深度学习语义分割语义特征上下文信息深度融合

    基于环境反馈机制的四足机器人运动技能学习

    张思远朱晓庆阮晓钢李春阳...
    1461-1468页
    查看更多>>摘要:哺乳动物的运动学习机制已得到广泛研究,犬科动物可以根据环境反馈的引导性信息自主地学习运动技能,对其提供更为特定的训练引导可以加快其对相关任务的学习速度。受上述启发,在软演员-评论家算法(SAC)的基础上提出一种基于期望状态奖励引导的强化学习算法(DSG-SAC),利用环境中的状态反馈机制来引导四足机器人进行有效探索,可以提高四足机器人仿生步态学习效果,并提高训练效率。在该算法中,策略网络与评价网络先近似拟合期望状态观测与当前状态的误差,再经过当前状态的正反馈后输出评价函数与动作,使四足机器入朝着期望的方向动作。将所提出算法在四足机器人上进行验证,通过实验结果可知,所提出的算法能够完成四足机器人的仿生步态学习。进一步,设计消融实验来探讨超参数温度系数和折扣因子对算法的影响,实验结果表明,改进后的算法具有比单纯的SAC算法更加优越的性能。

    强化学习四足机器人仿生步态学习环境探索状态反馈引导

    基于多级隐空间信息约束的噪声人脸超分辨率算法

    滕辎于晓升吴成东
    1469-1477页
    查看更多>>摘要:为了实现强噪声和模糊干扰下的低清人脸图像重建,提出一种基于多级隐空间信息约束的噪声人脸超分辨率算法。首先设计一个用于人脸有效信息提取的特征蒸馏网络,并通过统计性抗干扰模型和隐空间特征对比算法移除噪声等无效信息,构建一个具有高噪声鲁棒性的人脸信息提取模型;然后,设计人脸重建网络,该网络利用提取的人脸特征重建高清人脸图像;最后,通过人脸身份嵌入模型和离散小波变换模型,分别从超球面身份度量空间和小波域进一步对重建人脸的身份信息和空间结构进行约束。实验结果表明,所提出的算法不仅能够有效去除高噪声环境下的人脸噪声,而且还能有效提升人脸图像分辨率,获得更高的峰值信噪比(peak signal-to-noise ratio,PSNR)和结构相似度(structural similarity index,SSIM),具有较好的实用性。

    特征蒸馏隐空间信息约束图像超分辨率图像去噪深度神经网络超球面度量空间小波变换

    基于实例与目标相关性的多目标稀疏回归算法

    何杜博孙胜祥
    1478-1486页
    查看更多>>摘要:针对传统多目标回归算法无法处理输入与多输出间的非线性关系,且忽视了数据点在输入与输出之间的结构信息,导致算法泛化性能受限、缺乏稳健性等问题,提出一种基于实例与目标相关性的多目标稀疏回归(multi-target sparse regression with instances and targets correlations,MTR-ITC)算法。首先,通过嵌入潜变量空间来对复杂的输入与输出以及输出间的关联结构解耦,并利用核技巧和稀疏回归学习输入输出间的非线性关系和输出间的相关结构;然后,引入流形正则化项探索不同实例在输入与输出变量间的相关性,确保模型输出与真实结果在局部和全局结构的一致性,以提升模型泛化性能;最后,提出一种交替优化算法来对目标函数进行求解,使其能快速收敛至全局最优。在基准测试数据集上的实验表明,所提算法在不同MTR数据集上均具有较好的测试性能。

    多目标回归稀疏学习流形学习交替优化算法核方法实例相关性

    不平衡电网电压下MMC-UPQC的无源超螺旋二阶滑模控制策略

    黄祖繁周建萍茅大钧齐国庆...
    1487-1497页
    查看更多>>摘要:基于模块化多电平换流器(modular multilevel converter,MMC)的统一电能质量调节器(unified power quality conditioner,UPQC)在电网电压不平衡时,采用传统控制方法存在补偿效率和精确性较低的问题。针对这一情况,提出一种无源超螺旋二阶滑模控制策略。首先,基于MMC-UPQC的数学模型和无源控制理论,设计不平衡电网电压下基于欧拉-拉格朗日模型的正负序无源控制器;然后,加入超螺旋二阶滑模控制对无源控制器进行改善,抑制常规滑模存在的抖振,并解决无源控制对系统精度要求高的问题,提高系统的响应速度、补偿精度和抗干扰能力,提升系统的整体性能;最后,在Matlab/Simulink平台上进行仿真,并与PI控制和单独的无源控制对比,仿真结果验证了所提无源超螺旋二阶滑模控制策略的有效性和优越性。

    模块化多电平换流器统一电能质量调节器电网电压不平衡无源超螺旋二阶滑模控制欧拉-拉格朗日模型

    基于有限时间指令滤波的非线性系统固定时间预设性能控制

    李应森陈明姜海洋苏亚坤...
    1498-1506页
    查看更多>>摘要:针对一类严格反馈非线性系统,提出一种基于有限时间指令滤波的自适应固定时间预设性能控制策略。首先,引用非线性映射技术及适当的误差变换,建立等效的误差模型;其次,综合利用反步法、固定时间控制和自适应控制等方法,设计一种基于有限时间指令滤波的预设性能跟踪控制器。该策略应用指令滤波器解决了反步法中对虚拟控制律反复求导问题,减轻了计算负担。此外,预设性能控制和固定时间控制保证了系统的跟踪误差能够在固定时间内收敛到预设性能函数限定的范围内,其收敛时间与系统初始条件无关,且确保系统中全部信号在有限时间均达到有界区域。理论分析与仿真验证均表明了所提出设计方法的有效性。

    有限时间指令滤波固定时间控制预设性能跟踪控制反步法