首页 | 本学科首页   官方微博 | 高级检索  
     

一个因素化SARSA(λ)激励学习算法
作者姓名:陈焕文  谢建平  谢丽娟
作者单位:1. 长沙电力学院数学与计算机系
2. 长沙交通学院网络中心
摘    要:基于状态的因素化表达,提出了一个新的SARSA(λ)激励学习算法,其基本思想是根据状态的特征得出状态相似性启发式,再根据该启发式对状态空间进行聚类,大大减少 了空间搜索与计算的复杂度,因此比较适用于求解大状态空间的MDPs问题。

关 键 词:激励学习 状态聚类 因素化SARSA(λ)算法 学习算法 人工智能
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号