重庆理工大学学报2022,Vol.36Issue(12) :110-120.DOI:10.3969/j.issn.1674-8425(z).2022.12.013

藏族久棋的一种两阶段计算机博弈算法

A two-staged computer game algorithm for Tibetan Jiu Chess

李霞丽 陈彦东 杨子熠 张焱垠 吴立成
重庆理工大学学报2022,Vol.36Issue(12) :110-120.DOI:10.3969/j.issn.1674-8425(z).2022.12.013

藏族久棋的一种两阶段计算机博弈算法

A two-staged computer game algorithm for Tibetan Jiu Chess

李霞丽 1陈彦东 1杨子熠 1张焱垠 1吴立成1
扫码查看

作者信息

  • 1. 中央民族大学 信息工程学院, 北京 100081
  • 折叠

摘要

为了进一步提升布局的质量以提升藏族久棋博弈智能体程序棋力,提出了藏族久棋的一种两阶段计算机博弈算法,为藏族久棋的布局阶段设计了基于卷积神经网络和蒙特卡洛树搜索的自对弈算法,通过卷积神经网络指导蒙特卡洛树进行搜索,训练出最优模型并生成质量更高的着法;为战斗阶段设计了基于领域知识的Alpha-Beta剪枝算法.通过设计分阶段算法的方式将深度强化学习与领域知识相结合,试图解决藏族久棋博弈算法研究棋谱数据匮乏、博弈智能体的棋力水平较低等问题.实验结果表明:基于两阶段算法的博弈智能体程序与全局使用Alpha-Beta剪枝算法的博弈程序、人类一段棋手进行对弈,分别取得了65%、60%的胜率.基于两阶段算法的博弈智能体程序在一定程度上具备了"学习"和"思考"的能力,棋力得到了提升.

关键词

藏族久棋/卷积神经网络/蒙特卡洛树搜索/自对弈/Alpha-Beta剪枝

引用本文复制引用

基金项目

国家自然科学基金(61873291)

国家自然科学基金(61773416)

国家自然科学基金(62276285)

出版年

2022
重庆理工大学学报
重庆理工大学

重庆理工大学学报

CSTPCD北大核心
影响因子:0.567
ISSN:1674-8425
被引量2
参考文献量10
段落导航相关论文