首页 | 本学科首页   官方微博 | 高级检索  
     

融合聚类触发对特征的最大熵词性标注模型
引用本文:赵岩,王晓龙,刘秉权,关毅.融合聚类触发对特征的最大熵词性标注模型[J].计算机研究与发展,2006,43(2):268-274.
作者姓名:赵岩  王晓龙  刘秉权  关毅
作者单位:哈尔滨工业大学计算机科学与技术学院,哈尔滨,150001
基金项目:中国科学院资助项目;国家科技攻关项目
摘    要:为解决传统HMM词性标注模型不能包含远距离词特征的问题,提出了形如“WA→WB/TB”的触发对来承载远距离词特征信息,并采用平均互信息量度对触发对特征进行选择.在最大熵框架下,将选择后的触发对特征加入到词性标注系统中.利用矢量空间模型提供的语义相似度计算功能进行词语聚类,聚类的结果和语义词典融合,建立聚类触发对特征用来解决触发词“%”的数据稀疏问题.实验结果表明,与HMM相比,融合了聚类触发对特征的最大熵模型标注错误率减少了34%.

关 键 词:词性标注  最大熵模型  矢量空间模型  语义相似度计算  触发对
收稿时间:09 1 2004 12:00AM
修稿时间:2004-09-012005-04-25

Fusion of Clustering Trigger-Pair Features for POS Tagging Based on Maximum Entropy Model
Zhao Yan,Wang Xiaolong,Liu Bingquan,Guan Yi.Fusion of Clustering Trigger-Pair Features for POS Tagging Based on Maximum Entropy Model[J].Journal of Computer Research and Development,2006,43(2):268-274.
Authors:Zhao Yan  Wang Xiaolong  Liu Bingquan  Guan Yi
Affiliation:School of Computer Science and Technology, Harbin Institute of Technology, Harbin 150001
Abstract:
Keywords:POS tagging  maximum entropy model  vector space model  semantic similarity calculation  trigger pair
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号