首页 | 本学科首页   官方微博 | 高级检索  
     

中非时齐折扣模型向时齐折扣模型的转化问题
作者姓名:张继红 谭兴华
摘    要:在状态和行动集均可数,报酬函数有界条件下,建立起非时齐折扣MDP的对应时齐折扣MDP模型,并证明两者等价,从而把非时齐折扣MDP问题特化为一个与之等价的时齐折扣MDP问题,使时齐折扣MDP的结果对非时齐情况也成立,鉴于时齐折扣模型的讨论比较充分,这就带来了非对齐折扣模型的完满结论,并且这一转化过程揭示了非时齐与时齐折扣模型的内在联系。

关 键 词:非时齐折扣MDP 时齐折扣MDP 模型转化
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号