一种结合策略价值网络的五子棋自博弈方法研究

扫码查看

原文链接

国家科技期刊平台
NETL
NSTL
万方数据

中文摘要：针对传统蒙特卡洛树搜索算法存在"难以在节点的探索和利用之间做出平衡;难以聚焦重要搜索分支"等问题,提出使用策略价值网络完成棋局评估与落子着法生成,将策略价值网络与蒙特卡洛树搜索相结合.策略价值网络指导搜索树的展开,搜索结果用以持续更新网络参数,形成一种自博弈方法,在多轮自博弈中实现算法的迭代优化.实验表明:相较于各种经典搜索算法,所提算法在平均落子时间上降低了约95％,平均对局胜率达到80％以上.

外文标题：Research on a self-play method of Gobang combined with a strategic value network

作者：

刘溜、张小川、彭丽蓉、田震、万家强、任越

展开 >

作者单位：

重庆理工大学两江人工智能学院, 重庆 401135

重庆理工大学人工智能系统研究所, 重庆 400054

重庆工业职业技术学院人工智能与大数据学院, 重庆 401120

重庆市南开两江中学校, 重庆 401135

展开 >

关键词：

蒙特卡洛树搜索深度神经网络五子棋计算机博弈自博弈

基金：

国家自然科学基金

项目编号：

60443004

出版年：

2022

DOI：

10.3969/j.issn.1674-8425(z).2022.12.015

重庆理工大学学报

重庆理工大学

重庆理工大学学报

CSTPCD北大核心

影响因子：0.567

ISSN：1674-8425

年,卷(期)：2022.36(12)

被引量2
参考文献量8