一种基于状态聚类的SARSA(λ)强化学习算法 SARSA(λ) Algorithm of Reinforcement Learning Basd on States Clustering期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

一种基于状态聚类的SARSA(λ)强化学习算法

引用本文：	李春贵,吴沧浦,刘永信.一种基于状态聚类的SARSA(λ)强化学习算法[J].计算机工程,2003,29(5):37-38,98.

作者姓名：	李春贵吴沧浦刘永信

作者单位：	北京理工大学自动控制系,北京,100081

摘要：	为求解大状态空间的强化学习问题，提出了一种基于状态聚类的SARSA（λ）强化学习算法，其基本思想是利用先验知识或事先训练控制器，对状态空间进行聚类，分为不同的簇，然后在簇空间上进行SARSA（λ）学习，若能进行适当的状态聚类，算法将可得到一个相对好的近似值函数。
关键词：	SARSA（λ）强化学习算法状态聚类强化学习函数近似 SARSA学习人工神经网络
文章编号：	1000-3428(2003)05-0037-02
SARSA(λ) Algorithm of Reinforcement Learning Basd on States Clustering

LI Chungui,WU Cangpu, LIU Yongxin.SARSA(λ) Algorithm of Reinforcement Learning Basd on States Clustering[J].Computer Engineering,2003,29(5):37-38,98.

Authors:	LI Chungui WU Cangpu LIU Yongxin

Abstract:

Keywords:	Reinforcement learning Function approximation State space clustering SARSA learning
本文献已被 CNKI 维普万方数据等数据库收录！