首页 | 本学科首页   官方微博 | 高级检索  
     

基于信息熵的POMDP模型观测函数估计
作者单位:;1.北京邮电大学
摘    要:部分可观测马尔可夫决策过程(POMDP)广泛应用于建模决策任务。模型中的观测矩阵主要用来建模环境的不确定性,通常很难从训练数据中直接获取,需要引入额外的信息进行估计。通过引入信息熵来修正模型中的观测矩阵,修正后的观测矩阵更能反映环境的不确定性。模拟环境下的实验表明,引入信息熵进行修正估计的观测矩阵有效提高了POMDP模型的性能,而在基于POMDP模型的对话系统中,修正的估计提高了系统的决策准确度。

关 键 词:部分可观测马尔可夫决策过程  不确定性  意图识别  观测矩阵  信息熵

Information Entropy Based Estimation for Observation Function of POMDP Model
Abstract:
Keywords:
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号