首页 | 本学科首页   官方微博 | 高级检索  
     

马尔可夫决策过程两种抽象模式
引用本文:王蓁蓁,邢汉承,张志政,倪庆剑.马尔可夫决策过程两种抽象模式[J].计算机科学,2008,35(10):6-14.
作者姓名:王蓁蓁  邢汉承  张志政  倪庆剑
作者单位:1. 东南大学计算机科学与工程学院 南京 210096
2. 东南大学计算机科学与工程学院,南京,210096;南京大学计算机软件新技术国家重点实验室 南京 210093
基金项目:国家自然科学基金会重大研究计划项目,计算机软件新技术开放课题
摘    要:抽象层次上马尔可夫决策过程的引入,使得人们可简洁地、陈述地表达复杂的马尔可夫决策过程,解决常规马尔可夫决策过程(MDPs)在实际中所遇到的大型状态空间的表达问题.介绍了结构型和概括型两种不同类型抽象马尔可夫决策过程基本概念以及在各种典型抽象MDPs中的最优策略的精确或近似算法,其中包括与常规MDPs根本不同的一个算法:把Bellman方程推广到抽象状态空间的方法,并且对它们的研究历史进行总结和对它们的发展做一些展望,使得人们对它们有一个透彻的、全面而又重点的理解.

关 键 词:情景演算  因子化马尔可夫决策过程  逻辑马尔可夫决策过程  关系马尔可夫决策过程  Bellman方程

Two Classes of Abstract Modes about Markov Decision Processes
WANG Zhen-zhen,XING Han-cheng,ZHANG zhi-zheng,NI Qing-jian.Two Classes of Abstract Modes about Markov Decision Processes[J].Computer Science,2008,35(10):6-14.
Authors:WANG Zhen-zhen  XING Han-cheng  ZHANG zhi-zheng  NI Qing-jian
Affiliation:WANG Zhen-zhen1 XING Han-cheng1 ZHANG Zhi-zheng 1,2 NI Qing-jian 1(School of Computer Science & Engineering,Southeast University,Nanjing 210096,China)1(State Key Laboratory for Novel Software Technology,Nanjing University,Nanjing 210093,China)2
Abstract:Using Markov decision processes on abstract level,one can compactly and declaratively represent complex Markov decision processes.And one can solve real-world problems that generally have very large state space with regular MDPs.This paper introduces central concepts of two classes of abstract MDPs:structured mode and generalized mode.Then precise or approximate algorithms for looking for optimal policy for abstract MDPs are reviewed,including an algorithm that is totally different from regular Markov decis...
Keywords:Situation calculus  Factored Markov decision processes  Logical Markov decision processes  Relational Mar-kov decision processes  Bellman equations  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机科学》浏览原始摘要信息
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号