首页 | 本学科首页   官方微博 | 高级检索  
     

发现和学习不可复位动态系统的预测状表示的一种新算法
引用本文:刘云龙,李人厚.发现和学习不可复位动态系统的预测状表示的一种新算法[J].电子学报,2009,37(1).
作者姓名:刘云龙  李人厚
作者单位:西安交通大学系统工程研究所,陕西西安,710049
基金项目:国家211工程资助项目,西安交通大学行动计划 
摘    要:提出了一种发现和学习不可复位动态系统的预测状态表示的新算法.在证明系统的任意landmark均可作为系统的初始状态的基础上,利用发现的landmark确定系统在任意时间步所处的经历,然后采用蒙特卡罗方法估计任意经历下任意检验发生的概率,解决了在不可复位动态系统中,经历下检验发生的概率难以获取问题,进而发现和学习不可复位动态系统的预测状态表示.实验结果表明,本文算法获得的系统的预测状态表示在预测精度上明显优于suffix-history算法,验证了所提算法的有效性.

关 键 词:预测状态表示  不可复位动态系统  suffix-history算法

A New Algorithm for Discovery and Learning of Predictive State Representations in Dynamical Systems Without Reset
LIU Yun-long,LI Ren-hou.A New Algorithm for Discovery and Learning of Predictive State Representations in Dynamical Systems Without Reset[J].Acta Electronica Sinica,2009,37(1).
Authors:LIU Yun-long  LI Ren-hou
Abstract:
Keywords:landmark
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号