首页 | 本学科首页   官方微博 | 高级检索  
     

马尔可夫决策过程自适应决策的进展
引用本文:李江洪,韩正之.马尔可夫决策过程自适应决策的进展[J].控制与决策,2001,16(1):7-11.
作者姓名:李江洪  韩正之
作者单位:上海交通大学 智能工程研究所,
基金项目:国家自然科学基金项目! (6 98740 2 5 )
摘    要:在介绍一般马尔可夫决策过程的基础上,分析了当前主要马尔可夫过程自适应决策方法的基本思想、具体算法实现以及相应结论,总结了现有马尔可夫过程自适应决策算法的特点,并指出了需要进一步解决的问题。

关 键 词:马尔可夫过程  自适应决策  目标函数  随机化  解析模型
文章编号:1001-0920(2001)01-0007-05

New Achievements in Adaptive Markov Decision Process
LI Jiang-hong,HAN Zheng-zhi.New Achievements in Adaptive Markov Decision Process[J].Control and Decision,2001,16(1):7-11.
Authors:LI Jiang-hong  HAN Zheng-zhi
Abstract:Based on an introduction of MDP, main results of algorithms, principles, implementation and conclusions for adaptive MDP are analyzed in detail. The characters of these algorithms are summarized. Problems needing further discussing for adaptive MDP are also pointed out.
Keywords:Markov decision process (MDP)  partial observable MDP (POMDP)  adaptive decision
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《控制与决策》浏览原始摘要信息
点击此处可从《控制与决策》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号