首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于改进的最大熵模型的汉语词性自动标注的新方法
引用本文:赵伟,赵法兴,王东海,韩达奇.一种基于改进的最大熵模型的汉语词性自动标注的新方法[J].计算机研究与发展,2006,43(Z3).
作者姓名:赵伟  赵法兴  王东海  韩达奇
基金项目:吉林省科技条件平台建设基金
摘    要:最大熵模型已成为自然语言处理领域中的研究热点,但由于熟语料库规模的限制,模型参数会出现稀疏现象,影响了模型的精确度.另外最大熵模型参数众多、计算量大,一个好的参数估计算法将会有效地提高模型的效率.实验证明,采用BLMVM算法的基于Gaussian prior平滑技术的最大熵模型具有出色的表现.基于以上认识,结合汉语自身的特点,设计了一个基于词和字特征的汉语词性自动标注系统,取得了较好的标注效果.

关 键 词:最大熵模型  词性标注  prior平滑方法  BLMVM算法

A Chinese Part-of-Speech Based on Improved Maximum Entropy Model
Zhao Wei,Zhao Faxing,Wang Donghai,Han Daqi.A Chinese Part-of-Speech Based on Improved Maximum Entropy Model[J].Journal of Computer Research and Development,2006,43(Z3).
Authors:Zhao Wei  Zhao Faxing  Wang Donghai  Han Daqi
Abstract:
Keywords:Gaussian
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号