首页 | 本学科首页   官方微博 | 高级检索  
     

基于信念点裁剪策略树的POMDP求解算法
引用本文:郑红燕,仵博,冯延蓬,孟宪军.基于信念点裁剪策略树的POMDP求解算法[J].信息与控制,2013(1):53-57.
作者姓名:郑红燕  仵博  冯延蓬  孟宪军
作者单位:深圳职业技术学院;中南大学
基金项目:国家自然科学基金资助项目(61074058);广东省自然科学基金资助项目(S2011040004769)
摘    要:针对大规模部分可观察马尔可夫决策过程(POMDP)算法中策略树规模指数级增长、已证信念点(witness point,WP)求解困难的问题,根据策略树值函数是分段线性凸函数的特点,提出一种基于信念点的策略树增量裁剪和值迭代求解算法.在策略树生成过程中,利用边界点进行无损裁剪,利用中间点进行有损裁剪,并利用实时信念状态分布求取近似最优解.对比实验结果表明,该算法能快速收敛,以更少的时间获得相当精度的奖赏值.

关 键 词:部分可观察马尔科夫决策过程(POMDP)  策略树  信念状态  基于点  增量裁剪

Belief Point-based POMDP Solution for Policy Tree Pruning
ZHENG Hongyan,WU Bo,FENG Yanpeng,MENG Xianjun.Belief Point-based POMDP Solution for Policy Tree Pruning[J].Information and Control,2013(1):53-57.
Authors:ZHENG Hongyan  WU Bo  FENG Yanpeng  MENG Xianjun
Affiliation:1(1.Shenzhen Polytechnic,Shenzhen 518055,China;2.Central South University,Changsha 410083,China)
Abstract:
Keywords:
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号