首页 | 本学科首页   官方微博 | 高级检索  
     

基于未来阈值的马尔可夫策略的最优化算法
引用本文:姜峰,回钰.基于未来阈值的马尔可夫策略的最优化算法[J].吉林化工学院学报,2004,21(2):97-99.
作者姓名:姜峰  回钰
作者单位:菏泽师范专科学校,数理统计系,山东,菏泽,274015;菏泽师范专科学校,数理统计系,山东,菏泽,274015
摘    要:在一种新的准则概率阈值准则下讨论马尔可夫决策的最优解的算法问题.在该准则下,采用基于未来阈值的方法,求解马尔可夫最优策略.

关 键 词:Markov决策过程  Markov最优策略  概率阈值准则
文章编号:1007-2853(2004)02-0097-03
修稿时间:2003年10月28

Algorithm of Markov optimum policy based on future threshold value
JIANG Feng,HUI Yu.Algorithm of Markov optimum policy based on future threshold value[J].Journal of Jilin Institute of Chemical Technology,2004,21(2):97-99.
Authors:JIANG Feng  HUI Yu
Abstract:The arithmetic problem of Markov optimum solution under a new principle named probability threshold value principle is discussed.With this principle,the Markov optimum policy is solved based on the future threshold value.
Keywords:markov decision processes  markov optimum policy  probability threshold value
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号