首页|多Agent学习的Q方法

多Agent学习的Q方法

扫码查看
为了在多agent系统学习时使学习效果体现最大的群体利益,提出了一种多agent学习方法---Q学习方法。它是利用强化学习的理论和返回的奖励值来确定的,该方法在实际应用中有一定的参考价值,但也存在一些不足有待进一步完善。

陈淑凤

展开 >

武汉大学珞珈学院

多agent学习 确定环境 不确定环境 Q学习

2014

科技研究

科技研究

ISSN:
年,卷(期):2014.(16)
  • 1