重庆理工大学学报2022,Vol.36Issue(12) :121-128.DOI:10.3969/j.issn.1674-8425(z).2022.12.014

"拱猪"游戏的深度蒙特卡洛博弈算法

Deep Monte Carlo algorithm for Gongzhu game

吴立成 吴启飞 钟宏鸣 李霞丽
重庆理工大学学报2022,Vol.36Issue(12) :121-128.DOI:10.3969/j.issn.1674-8425(z).2022.12.014

"拱猪"游戏的深度蒙特卡洛博弈算法

Deep Monte Carlo algorithm for Gongzhu game

吴立成 1吴启飞 1钟宏鸣 1李霞丽1
扫码查看

作者信息

  • 1. 中央民族大学 信息工程学院, 北京 100081
  • 折叠

摘要

针对现有的"拱猪"卷积模型计算复杂且高度依赖专家知识的问题,提出一种应用于"拱猪"博弈游戏的深度神经网络和蒙特卡洛方法相结合的深度蒙特卡洛算法.采用自对弈的方式进行模拟和评估,使用深度Q网络代替Q表完成Q值的更新,高效地对"拱猪"策略进行探索和利用;采用分布式并行计算的方法提高训练效率,较于传统的蒙特卡洛方法可有效地解决高方差问题.在具有一个GPU的单台服务器上训练24 h后,所构建的智能代理与"拱猪"卷积模型对弈了10000局.实验结果表明:智能代理胜率可达78.3%,平均每局可获得67分,对具体示例进行分析,进一步验证了该算法的有效性以及智能代理的良好性能.

关键词

人工智能/拱猪/深度强化学习/蒙特卡洛方法

引用本文复制引用

基金项目

国家自然科学基金(62276285)

出版年

2022
重庆理工大学学报
重庆理工大学

重庆理工大学学报

CSTPCD北大核心
影响因子:0.567
ISSN:1674-8425
被引量2
参考文献量3
段落导航相关论文