基于改进的隐马尔科夫模型的汉语词性标注 |
| |
作者姓名: | 王敏 郑家恒 |
| |
作者单位: | 山西大学,计算机与信息技术学院,山西,太原,030006 |
| |
基金项目: | 国家自然科学基金;山西省自然科学基金 |
| |
摘 要: | 基于传统隐马尔科夫(HMM)模型的基础上,对词语的词汇发射概率做出了新的假设,从而更好地体现了该词语与上下文依赖关系.还利用指数线性插值平滑算法对参数进行了有效平滑,并且给出了未登录词词汇发射概率估计模型.实验结果证明,改进后的模型明显优于传统HMM词性标注模型的效果.
|
关 键 词: | 中文信息处理 词性标注 隐马尔科夫模型 平滑算法 未登录词 |
文章编号: | 1001-9081(2006)12Z-0197-02 |
修稿时间: | 2006-07-05 |
本文献已被 CNKI 万方数据 等数据库收录! |
|