首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于状态聚类的SARSA(λ)强化学习算法
引用本文:李春贵,吴沧浦,刘永信.一种基于状态聚类的SARSA(λ)强化学习算法[J].计算机工程,2003,29(5):37-38,98.
作者姓名:李春贵  吴沧浦  刘永信
作者单位:北京理工大学自动控制系,北京,100081
摘    要:为求解大状态空间的强化学习问题,提出了一种基于状态聚类的SARSA(λ)强化学习算法,其基本思想是利用先验知识或事先训练控制器,对状态空间进行聚类,分为不同的簇,然后在簇空间上进行SARSA(λ)学习,若能进行适当的状态聚类,算法将可得到一个相对好的近似值函数。

关 键 词:SARSA(λ)强化学习算法  状态聚类  强化学习  函数近似  SARSA学习  人工神经网络
文章编号:1000-3428(2003)05-0037-02

SARSA(λ) Algorithm of Reinforcement Learning Basd on States Clustering
LI Chungui,WU Cangpu, LIU Yongxin.SARSA(λ) Algorithm of Reinforcement Learning Basd on States Clustering[J].Computer Engineering,2003,29(5):37-38,98.
Authors:LI Chungui  WU Cangpu  LIU Yongxin
Abstract:
Keywords:Reinforcement learning  Function approximation  State space clustering  SARSA learning  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号