科技信息(学术版)2011,Issue(11) :183-183.

浅析强化学习算法研究与应用

科技信息(学术版)2011,Issue(11) :183-183.

浅析强化学习算法研究与应用

扫码查看

摘要

人类通常从与外界环境的交互中学习。所谓强化(reinforcement)学习是指从环境状态到行为映射的学习,以使系统行为从环境中获得的累积奖励值最大。在强化学习中,我们设计算法来把外界环境转化为最大化奖励量的方式的动作。

关键词

强化学习/机器学习/智能控制

引用本文复制引用

出版年

2011
科技信息(学术版)
山东省技术开发服务中心

科技信息(学术版)

ISSN:1001-9960
段落导航相关论文