一类基于启发式搜索的激励学习算法 |
| |
引用本文: | 唐中勇,付强,卓佳,陈焕文.一类基于启发式搜索的激励学习算法[J].计算机技术与发展,2006,16(8):41-43. |
| |
作者姓名: | 唐中勇 付强 卓佳 陈焕文 |
| |
作者单位: | 长沙理工大学计算机通讯工程学院,湖南长沙410076 |
| |
摘 要: | 激励学习已被证明是在控制领域中一种可行的新方法。相比其他的方法,它能较好地处理未知环境问题,但它仍然不是一种有效的方法。幸运的是,在现实世界中,智能体总是会有一些环境的先验知识,这些能形成启发式信息。启发式搜索是一种常用的搜索方法,有很快的搜索速度,但需要精确的启发式信息,这在有些时候难以得到。文中分析比较了启发式搜索和激励学习的各自特点,提出一类新的基于启发式搜索的激励学习算法,初步的实验结果显示了较好的性能。
|
关 键 词: | 启发式搜索 激励学习 启发式SARSA |
A Class of Reinforcement Learning Algorithm Based on Heuristic Search |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 维普 万方数据 等数据库收录! |
|