首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于信念状态压缩的实时POMDP算法
引用本文:仵博,吴敏.一种基于信念状态压缩的实时POMDP算法[J].控制与决策,2007,22(12):1417-1420.
作者姓名:仵博  吴敏
作者单位:中南大学,信息科学与工程学院,长沙,410083;深圳职业技术学院,计算机应用工程系,广东,深圳,518055;中南大学,信息科学与工程学院,长沙,410083
基金项目:国家十五863计划项目(2001AA4422200).
摘    要:针对求解部分可观察马尔可夫决策过程(POMDP)信念状态空间是NP难问题.提出一种信念状态空间压缩(BSSC)算法.将信念状态空间的高维压缩到低维,利用动态贝叶斯网络对状态转移函数、观察函数和报酬函数进行压缩。降低求解规模,达到实时决策的目的.对比实验表明,所提出的算法可以快速求解最优策略和最优值函数.

关 键 词:马尔可夫  可观察马尔可夫决策过程  决策算法  决策树
文章编号:1001-0920(2007)12-1417-04
收稿时间:2006-09-11
修稿时间:2006-11-20

Real-time POMDP algorithm based on belief states space compression
WU Bo,WU Min.Real-time POMDP algorithm based on belief states space compression[J].Control and Decision,2007,22(12):1417-1420.
Authors:WU Bo  WU Min
Abstract:
Keywords:Markov  POMDP  Decision algorithm  Decision tree
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《控制与决策》浏览原始摘要信息
点击此处可从《控制与决策》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号