一类基于启发式搜索的激励学习算法 A Class of Reinforcement Learning Algorithm Based on Heuristic Search期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

一类基于启发式搜索的激励学习算法

引用本文：	唐中勇,付强,卓佳,陈焕文.一类基于启发式搜索的激励学习算法[J].计算机技术与发展,2006,16(8):41-43.

作者姓名：	唐中勇付强卓佳陈焕文

作者单位：	长沙理工大学计算机通讯工程学院,湖南长沙410076

摘要：	激励学习已被证明是在控制领域中一种可行的新方法。相比其他的方法，它能较好地处理未知环境问题，但它仍然不是一种有效的方法。幸运的是，在现实世界中，智能体总是会有一些环境的先验知识，这些能形成启发式信息。启发式搜索是一种常用的搜索方法，有很快的搜索速度，但需要精确的启发式信息，这在有些时候难以得到。文中分析比较了启发式搜索和激励学习的各自特点，提出一类新的基于启发式搜索的激励学习算法，初步的实验结果显示了较好的性能。
关键词：	启发式搜索激励学习启发式SARSA
A Class of Reinforcement Learning Algorithm Based on Heuristic Search

Abstract:

Keywords:
本文献已被维普万方数据等数据库收录！