逻辑马尔可夫决策编程和关系马尔可夫决策编程若干最新进展 |
| |
作者姓名: | 王蓁蓁邢汉承 张志政倪庆剑 |
| |
作者单位: | 东南大学计算机科学与工程学院,南京,210096;东南大学计算机科学与工程学院,南京,210096;东南大学计算机科学与工程学院,南京,210096;东南大学计算机科学与工程学院,南京,210096 |
| |
摘 要: | 逻辑马尔可夫决策过程和关系马尔可夫决策过程的引入,使得人们可能简洁地、陈述地表达复杂的马尔可夫决策过程。本文首先介绍有关逻辑马尔可夫决策过程和关系马尔可夫决策过程的概念,然后重点介绍它们与普通的马尔可夫决策过程根本不同的一些算法:①依赖于基本状态空间RL的转换法;②把Bellman方程推广到抽象状态空间的方法;③利用策略偏置空间寻求近似最优策略方法。最后对它们的研究现状进行总结及其对它们发展的一些展望。
|
关 键 词: | 逻辑马尔可夫决策过程 关系马尔可夫决策过程 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
|