基于信息熵的POMDP模型观测函数估计 |
| |
作者单位: | ;1.北京邮电大学 |
| |
摘 要: | 部分可观测马尔可夫决策过程(POMDP)广泛应用于建模决策任务。模型中的观测矩阵主要用来建模环境的不确定性,通常很难从训练数据中直接获取,需要引入额外的信息进行估计。通过引入信息熵来修正模型中的观测矩阵,修正后的观测矩阵更能反映环境的不确定性。模拟环境下的实验表明,引入信息熵进行修正估计的观测矩阵有效提高了POMDP模型的性能,而在基于POMDP模型的对话系统中,修正的估计提高了系统的决策准确度。
|
关 键 词: | 部分可观测马尔可夫决策过程 不确定性 意图识别 观测矩阵 信息熵 |
Information Entropy Based Estimation for Observation Function of POMDP Model |
| |
Abstract: | |
| |
Keywords: | |
|
|