首页期刊导航|控制与决策
期刊信息/Journal information
控制与决策
控制与决策

张嗣瀛 王福利

月刊

1001-0920

kzyjc@mail.neu.edu.cn

024-83687766

110819

沈阳东北大学125信箱

控制与决策/Journal Control and DecisionCSCD北大核心CSTPCDEI
查看更多>>本刊创刊于1986年,由教育部主管,东北大学主办.本刊是自动控制与决策领域的综合性学术期刊,大16开,月刊,经邮局发行.本刊是研究生教育中文重要期刊,中文核心期刊,并已进入美国Ei等几大检索系统.本刊的影响因子历年在信息与系统类期刊中名列前茅.连续两年被评为百种中国杰出学术期刊.
正式出版
收录年代

    基于粒子群优化的德州扑克在线对手利用

    胡振震陈少飞袁唯淋李鹏...
    1687-1696页
    查看更多>>摘要:德州扑克中,相比于采用均衡策略求解的方法,对手利用是针对存在弱点的对手以获取更大收益的更有效方法。然而在面对一个全新对手时,在线条件下如何高效利用对手仍然是一大难题。现有方法常采用离线训练在线适应的方式来避开这一问题,即利用学习、演化等方法,通过海量离线训练来获得具有对手适应性的模型,使其能在比赛中适应不同的对手,而不是在比赛中针对一个新对手在线主动地优化自身策略。对此,以在线主动策略优化实现有效对手利用为目的,基于时间维的粒子定义提出一种基于粒子群优化的策略优化方法,将在线策略优化的思路引入德州扑克这种具有强随机性的博弈问题中,开展对手利用并实现在线比赛收益最大化。针对适应度计算受随机运气影响以及部分对手针对性策略难以优化的问题,提出一种基于局部最优解替代、全局最优解替代的改进粒子群优化算法(BR-PSO)。实验结果表明,对于标准PSO方法难以针对的对手,所提出的方法能有效获得对手的针对性策略以实现最大化对手利用,而且优化策略的收益能够媲美基于手牌预测AI的收益。

    粒子群优化策略优化最优解替代对手利用在线比赛德州扑克

    社交网络群决策环境下基于量子干涉的信任测度

    蔡玫简兴莲王雅
    1697-1706页
    查看更多>>摘要:针对已有的信任测度模型中信任源出现的冗余以及之间的干扰未被考虑的缺点,提出一种基于干扰效应的社会网络信任测度的决策模型。该模型在计算决策者之间的信任值时,通过简化信任源类型可避免部分信任源的重复出现,同时增加了信任源之间的干扰项。首先,根据社会关系与背景对信任的决定性,将决策者之间信任关系的来源划分为"决策者之间的亲近关系"和"决策者的客观背景";其次,提出"亲疏度"和"专业度"的概念作为这两个信任源的测度,在保证信任源完整的前提下,克服信任关系冗余的缺陷;然后,进一步设计考虑干扰效应的信任值量化方法,所求的信任值能够综合体现两个信任源的个体决定程度和整体影响程度;最后,将决策者的信任值转化为权重聚集决策者偏好,以解决实际群决策问题。数值和理论结果表明,所提出考虑干扰效应的信任测度方法能够作为提高信任关系的准确性以及解决社交网络群决策问题的工具,具有广泛的应用前景。

    信任源信任测度干扰效应概率语言术语集量子概率论社会网络

    基于自监督增强特征的直推式零样本图像分类

    王浩宇张欣然王雪松程玉虎...
    1707-1717页
    查看更多>>摘要:图像的视觉特征对实现零样本图像分类有至关重要的作用。尽管目前VGG、GoogLeNet和ResNet等网络提取的深度特征在图像分类领域获得了广泛的应用,但其在零样本图像分类问题上的表现并不理想,仍旧存在较大的提升空间。此外,由于零样本学习场景下训练集与测试集不相交的设定,导致分类网络不可避免地存在领域偏移问题。为此,提出一种基于自监督增强特征的直推式零样本图像分类框架。首先,通过辅助任务构造伪标签,利用自监督学习获得图像的自监督特征并将其与无监督深度特征进行特征融合;然后,将融合特征嵌入语义空间中进行零样本图像分类,并获得未见类的初始预测标签;最后,利用未见类特征和预测标签迭代地优化视觉-语义映射。所提出框架组件可选择,框架组件自监督网络、主干网络和降维网络分别选用CFN、VGG16和PCA构成网络。在CUB、SUN和AwA2数据集上的实验结果表明,所提出网络能够增强特征的判别能力,在零样本图像分类问题上表现良好。

    零样本学习自监督学习直推式视觉-语义映射特征融合图像分类

    考虑群体信任的网络安全态势多维偏好评级方法

    余高锋李登峰
    1718-1726页
    查看更多>>摘要:现有网络安全态势评级方法难以同时兼顾专家间信任信息、偏好信息以及客观异质信息等多源信息,为此,建立基于群体信任的网络安全态势多维偏好评级模型。在描述网络安全态势多维偏好评级问题的基础上,提出社会网络中信任信息不确定程度度量方法,进一步建立一种考虑单链信任信息不确定性和内部差异性、多链间信任非补偿性和内部差异性的不完整信任网络构造模型,据此确定专家权重;定义基于级别特征值的客观排序、专家偏好的群体一致性程度和群体非一致性程度,进一步建立包含专家信任信息、偏好信息和评级信息等在内的网络安全态势评级多维偏好分段变权综合优化模型,获得基于二元语义的网络安全态势等级和等级区分度。所提出方法为构建和检验网络安全态势评级提供理论依据,有助于研发先进的网络安全态势评级系统,提高网络安全防护能力。

    评级社会网络多维偏好分析网络安全

    基于任务分解与强化学习的多平台协同火力分配方法

    伍国华李冰洁袁于斐陆志沣...
    1727-1735页
    查看更多>>摘要:为了有效求解多平台协同火力分配问题,根据"分而治之"的思想,基于任务分解策略将复杂的决策任务分解为子目标平台选择和子平台火力分配两个阶段,通过融合启发式算法和强化学习模型,提出一种新的强化学习求解方法(HARL),并以多平台联合火力打击为作战背景进行实验仿真。子目标平台选择层根据当前状态,基于强化学习策略选择攻击当前子目标最适合的火力平台;而子平台火力分配层则使用启发式算法为执行攻击任务的平台规划最优的火力分配方案。实验结果表明,融合启发式算法和强化学习的HARL方法相比于传统的强化学习算法武器消耗量减少15%以上,相比于经典的启发式算法求解时效性提升20%以上,表明该研究成果可为未来求解复杂作战决策问题提供有力的技术支持。

    多平台协同火力分配强化学习任务分解迭代优化

    低碳驱动下考虑废钢质量的钢铁制造供应链稳定性分析

    袁静朱建军
    1736-1744页
    查看更多>>摘要:钢铁行业作为最大的碳排放主体,面对日益增大的环保压力,亟待改进工艺流程,提升以废钢为原材料的绿色清洁生产比例。对此,运用博弈论和混沌理论研究环保压力和废钢质量水平对供应链各博弈主体的影响。研究结果表明,外部环保压力的增大会促使钢铁企业逐步向以废钢为主要原料的清洁炼钢模式过渡,逐步提高废钢原料的质量才能使得废钢供应商和钢铁企业达到最优利润。然而,提高废钢原料的质量水平并不利于增强系统的稳定性。当前以铁矿石为主要原材料的钢铁冶炼模式应平稳渐进地向以废钢为原料的清洁生产模式过渡,并通过大数据等信息化技术加强钢铁市场的价格监管,引导企业自律,遵守市场规律调节原材料的价格;否则,价格调整参数超出阈值会导致整个钢铁市场动荡,甚至可能出现经济混沌以及钢铁企业破产。

    低碳废钢质量稳定性复杂性博弈论混沌理论

    离散线性系统有限频域基于观测器的迭代学习控制

    邹伟沈艳霞
    1745-1753页
    查看更多>>摘要:针对一类离散线性系统,在有限频域范围内研究基于观测器的迭代学习控制问题。首先,结合二维系统理论,构建由基于观测器的状态反馈和PID型前馈学习项组成的控制器;然后,借助于广义Kalman-Yakubovich-Popov(KYP)引理,将闭环系统有限频域性能规范转换为相应的线性矩阵不等式(LMI),进而得到控制器和观测器存在的充分条件,同时,该条件也确保闭环控制系统的稳定性和跟踪误差单调收敛性;最后,通过桁架机器人系统的仿真,验证所提出设计方法的有效性。

    迭代学习控制离散线性系统有限频域范围基于观测器的状态反馈广义KYP引理

    多智能体系统基于自适应控制下的二分-分量一致性

    华彩凤马忠军李科赞
    1754-1760页
    查看更多>>摘要:二分-分量一致性是指网络系统中部分具有相似特性智能体的某些分量随时间推移趋于相同的值,而剩余智能体的某些分量则随时间趋于相反的值,是一种弱于恒同一致和二分一致的动力学行为。为此,对符号网络上非线性多智能体系统的二分-分量一致性问题展开研究。首先,针对多智能体系统中各智能体之间存在的合作关系或竞争关系,设计有效的自适应牵制控制器;随后,基于Lyapunov稳定性理论和矩阵理论,导出该非线性系统二分-分量一致性得以实现的充分条件;最后,通过数值模拟验证理论结果。

    网络系统非线性多智能体系统自适应控制二分-分量一致

    《控制与决策》征稿简则

    封3页