一个因素化SARSA(λ)激励学习算法 |
| |
作者姓名: | 陈焕文 谢建平 谢丽娟 |
| |
作者单位: | 1. 长沙电力学院数学与计算机系 2. 长沙交通学院网络中心 |
| |
摘 要: | 基于状态的因素化表达,提出了一个新的SARSA(λ)激励学习算法,其基本思想是根据状态的特征得出状态相似性启发式,再根据该启发式对状态空间进行聚类,大大减少 了空间搜索与计算的复杂度,因此比较适用于求解大状态空间的MDPs问题。
|
关 键 词: | 激励学习 状态聚类 因素化SARSA(λ)算法 学习算法 人工智能 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |