首页 | 本学科首页   官方微博 | 高级检索  
     

一类Markov 决策过程自适应决策的新方法
引用本文:李江红,胡照文. 一类Markov 决策过程自适应决策的新方法[J]. 控制与决策, 2001, 16(4): 415-419
作者姓名:李江红  胡照文
作者单位:1. 上海交通大学电子信息学院
2. 中南大学铁道校区
摘    要:提出一种计算效率高且能以任意给定精度实现决策近优的新方法。该方法的原理是根据要求的决策精度对参数集进行有限区分,利用有偏极大似然估计器估计未知参数,并在决策过程中根据估计参数所在的分区获得控制对Markov过程进行决策。

关 键 词:Markov决策过程 有偏极大似然估计器 自适应决策 随机决策 自适应控制
文章编号:1001-0920(2001)04-0415-05
修稿时间:2000-01-10

New Algorithm for a Class of Adaptive Markov Decision Process
LI Jiang hong ,HU Zhao wen. New Algorithm for a Class of Adaptive Markov Decision Process[J]. Control and Decision, 2001, 16(4): 415-419
Authors:LI Jiang hong   HU Zhao wen
Affiliation:LI Jiang hong 1,HU Zhao wen 2
Abstract:A new algorithm for adaptive Markov Decision Process(MDP) is proposed, which can achieve optimal decision with any desired accuracy. The principle of the new algorithm is partitioning the parameter set according to the desired accuracy and using the policy related to the partition that the new estimated parameter exists to make decision.
Keywords:MDP (Markov Decision Process)  biased maximum likelihood estimator  adaptive decision
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《控制与决策》浏览原始摘要信息
点击此处可从《控制与决策》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号